广告

为深度学习、视觉处理打造的新芯片架构诞生

2016-11-05 08:10:00 Junko Yoshida 阅读:
当“深度学习”不仅热门,而且还趋近于技术成熟曲线的“沸点”时,对于另一波瞄准深度学习、视觉处理的新创公司如雨后春笋般出现,也就一点都不令人惊讶了。
广告

当“深度学习”不仅热门,而且还趋近于技术成熟曲线的“沸点”时,对于另一波瞄准深度学习、视觉处理的新创公司如雨后春笋般出现,也就一点都不令人惊讶了。

这次是一家称为ThinCI(发音为‘Think-Eye’)的公司,由一位出身英特尔背景的资深工程师/架构师Dinakar Munagala创办。

然而,令人惊讶的是,这家位于美国加州的新创公司不仅有资本雄厚、拥有技术专精的大厂支持,而且还提供了一种独特的“大规模平行架构”,Munagala称其为“专为视觉处理和深度学习而生”。

Munagala承诺,相较于其它深度学习/视觉处理方案,该公司目前专利申请中的芯片架构可以带来“两个数量级的性能提升”。

从一座车库开始,并以有限的资金熬过6年之后,ThinCI在上个月公开亮相。该公司最近还吸引了两家大型一线汽车供应商成为其机构投资者,而且还有一批在技术领域声誉显赫的大厂成为其私人投资者。

这两家汽车供应商分别是DENSO International America, Inc.,以及Magna International Inc.。私人投资者包括ThinCI董事会主席和Tallwood Venture Capital的管理合伙人Dado Banatao、英特尔架构部门前执行副总裁、总经理Dadi Perlmutter、巴斯夫(BASF)监事会主席和戴姆勒(Daimler)监事会成员Jurgen Hambrecht以及其他几位背景雄厚的资深人士。

简单、灵活

他们为什么投资ThinCI Perlmutter认为,“在整个职业生涯中,我非常欣赏简单和灵活性。我并不喜欢一些蛮横粗暴的方法,但着重于研究新运算问题的瓶颈,并且经由寻找新途径发现克服瓶颈的方法。ThinCI就是这么做的。”

当其它解决方案受限于数据的移入与移出,只为了填饱“饥饿”的巨大运算引擎时,Perlmutter形容ThinCI运算是一种“专为深度学习量身打造的图像分析法,省去了大量不必要的内存存取程序。”

而其最终的结果如何?“它不仅加快了指令周期,而且降低了成本和功耗,”他补充说。

Munagala说自己从六年前开始,就怀抱着开发一种新芯片架构,以满足下一代技术(如深度学习)需求的梦想,因此毅然决然地离开英特尔。

然而,ThinCI并未透露其处理器架构细节,而仅称其为“一种革命性的图像串流处理器” (Graph Streaming Pocessor)。Munagala解释,它是指“一种大规模的平行架构,专为同时处理任务图形的多项运算节点而设计。”

深度学习本质上是以一组算法为基础,透过具有多个处理层、由线性与非线性交易组成的深度图像,尝试在数据中建模高层级抽象。

ThinCI架构的独特之处似乎就在于其处理深度图像的方式。

Munagala解释,“ThinCI架构利用极端平行为整个图像任务串流数据,”取代以多个处理层透过深度图像连续处理数据的方式。

正如Perlmutter所说的,“ThinCI处理器架构的另一个关键要素是可编程性”。他解释说,许多人犯了针对特定方案进行硬件客制的错误,而历史教训是:问题是不断变化的,而程序设计人员拥有巨大的创造力。Perlmutter表示,ThinCI需要的是一种“对处理器进行编程以实现可不断发展新方案的方法。”

很显然地,这正是ThinCI所提供的。Munagala指出,设计人员“在使用业界标准API的同时,也受益于独特的编程方法。这使其简化打造为其处理器优化的深度网络。”

相较于市场上的其它处理器,Munagal以GPU为例指出,“尽管GPU已被用于深度学习(如Nvidia),但它并非为数据分析而设计的。它在视觉处理方面的效率不高,而且不仅功耗高、还需大量的内存。”DSP的问题则是编程的效率低且复杂。

那么,硬线组件如何?也不可行!因为对固定方案来说,用于深度学习的算法变化太快。 而CPU“仅适于通用目的”,因为它的效能不佳且功耗过高。

芯片上图像执行

相形之下,ThinCI的视觉运算引擎独到之处在于它提供了“芯片上图像执行”(on-die graph execution)。它是专为加速卷积神经网络(CNN)、深层神经网络(DNN)和其它复杂算法而设计的。更重要的是,该公司表示,来自摄影机传感器的资料“储存和处理都在芯片上完成,而无需DRAM存取。”
20161103 ThinCI NT31P1
图1:ThinCI的视觉运算引擎(VISCEN)硬件架构 来源:ThinCI

因此,Munagala认为,相较于其它的处理架构,ThinCI的视觉运算引擎可以带来更高性能、更低功耗、可编程性以及更少内存占用。

当然,视觉处理SoC市场已开始出现一些新的处理器。例如。最近被英特尔收购的Movidius就是一个很好的例子。它提供专为嵌入式市场设计的视觉处理器。

针对目前在深度学习中使用的架构,Munagala说:“就性能/体积、性能/功耗指针来说,ThinCI的解决方案更高出了13倍。”更重要的是,“就架构来说,我们的方案更具前瞻性,它能解决其它架构无法解决的问题。”他同时还强调“简单编程模型”的重要性。

获一线汽车供应商青睐

从两家大型一线供应商投资ThinCI来看,清楚地反映了三件事:第一,汽车产业对视觉处理和深度学习技术的巨大需求(他们认为尚未看到全貌);其次,对于让自动驾驶成为现实的坚定承诺;最后,一线厂商特别需要看到技术上的突破,让他们有足够的筹码与新贵金主平起平坐地谈判。

只需看看去年7月宣布成立的Mobileye/Intel/BMW联盟。很显然地,一线供应商都缺席了。

“DENSO一直在研究计算机视觉处理领域的新发展,而我们对ThinCI的投资更展现了坚定信念,即ThinCI的技术将很快成为下一代自动驾驶系统的关键组件——未来的新系统需要先进的运算技术结合深度学习能力,”DENSO创投总监Tony Cannestra在一份声明中说。

Magna首席技术官Swamy Kotagiri也表示:“我们很高兴能结合ThinCI在处理和软件领域的强项,以及Magna对于汽车系统的整体理解。”

在汽车市场之外

ThinCI并不仅着眼于汽车市场。毕竟,汽车领域的进展一向十分缓慢,特别是考虑到在最终生产前必须进行的所有测试和认证。但这对在其它领域寻找近期机会的任何新创公司都意味深长。

Munagala解释,视觉处理和深度学习应用“可以应用在任何地方”,从自然用户接口到监控摄影机甚至白色家电。

Perlmutter同意这样的看法。“汽车只是深度学习的一类应用,但深度学习却可因应大量的新问题类型。”

他解释说,“创造适用于所有类似人类行为的适应性方案,包括从视觉、语音,一直到巨量数据收集的优化算法,以及复杂的BOT与辅助等。”

Perlmutter认为,深度学习成效卓著,特别是“当我们从智能手机转移到增强实境(AR)类设备时。”他说,“我们与AR设备的互动,以及需要它提供的复杂程度(在办公室、制造厂房和旅途中),将远远超越当今与智能手机互动的笨拙方式。”

值得庆幸的是,ThinCI在嵌入式市场的优势在于其视觉运算引擎具有很高的可扩展性。 Munagala说:“我们能因应从可穿戴设备到内建通用软件堆栈的服务器等领域的多样化市场。”
20161103 ThinCI NT31P2
图2:新兴应用需要新的视觉处理技术 来源:ThinCI

时间表

根据ThinCI,其视觉运算引擎架构“已在2015年告一段落,其测试芯片也已经完成验证了。”该公司目前正筹措资金以实现计划于2017年启动的首次芯片生产。从今年初开始,ThinCI已经完成其软件工具套件的beta测试。

ThinCI的投资者对于该团队所提供的成果也信心满满。巴斯夫监事会主席和戴姆勒监事会成员Jurgen Hambrecht表示,由于“ThinCI拥有杰出的团队和能力”,让他决定了个人投资。

Hambrecht更看好的是,“ThinCI将为多样化的产业应用带来突破性的硬件软件。”

本文授权编译自EE Times,版权所有,谢绝转载

EETC wechat barcode


关注最前沿的电子设计资讯,请关注“电子工程专辑微信公众号”。

本文为EET电子工程专辑 原创文章,禁止转载。请尊重知识产权,违者本司保留追究责任的权利。
Junko Yoshida
ASPENCORE全球联席总编辑,首席国际特派记者。曾任把口记者(beat reporter)和EE Times主编的Junko Yoshida现在把更多时间用来报道全球电子行业,尤其关注中国。 她的关注重点一直是新兴技术和商业模式,新一代消费电子产品往往诞生于此。 她现在正在增加对中国半导体制造商的报道,撰写关于晶圆厂和无晶圆厂制造商的规划。 此外,她还为EE Times的Designlines栏目提供汽车、物联网和无线/网络服务相关内容。 自1990年以来,她一直在为EE Times提供内容。
  • Arm:赋能开发者,软硬协同重塑AI计算生态 硬件若无软件支持就毫无意义。而软件始终是Arm计算平台不可或缺的一部分,其技术已经涵盖整个软件栈的各个层面。从底层固件和操作系统的开发,到与游戏引擎、开源社区和独立软件供应商(ISV)的战略合作,确保所有这些在Arm平台上都能“开机即用”。
  • 芯原汪洋:塑造智能计算未来,为AI技术应用赋能 汪洋特别提到,第十三届芯原CEO论坛五大预测之一是2028年用于端侧微调卡和推理卡的销售额将超过用于云侧的训练卡。目前,推理和端侧微调也是芯原重点关注的领域,同时也希望在这一发展趋势中寻找新的机遇。 
  • 集成电路性能应如何验证? 随着对复杂IC的需求不断增长,供应商面临着越来越大的压力,需要在尽可能短的时间内交付最高质量的IC。本文阐述了测试工程在交付定制IC以满足这一需求方面的重要性。
  • 芯粒技术标准迈向3D时代 为了解决SiP生命周期中跨多个芯粒的可测试性、可管理性和调试设计挑战,UCIe 2.0版更新的一个关键特性在于支持3D封装。
  • 2024年是否将是先进封装之年? 先进封装技术继2023年成为突出亮点之后,今年继续掀起波澜,并与半导体行业新星——chiplet的命运密切相连。
  • 人工智能是否是硅光子的杀手级应用? 人工智能(AI)是促进硅光子技术广泛应用的杀手级应用吗?鉴于过去几年AI的爆炸式增长推动了对高速互连和更高带宽的需求,以及随之而来的以太网光收发器的需求,人们可能会这么认为。
  • “一碰交互,共触未来”ITMA峰会盛大 目前,智能终端NFC功能的使用频率越来越高,面对新场景新需求,ITMA多家成员单位一起联合推动iTAP(智能无感接近式协议)标准化项目,预计25年上半年发布1.0标准,通过功能测试、兼容性测试,确保新技术产业应用。
  • 中科院微电子所在忆阻神经-模糊硬 中科院微电子所集成电路制造技术重点实验室刘明院士团队提出了一种基于记忆交叉阵列的符号知识表示解决方案,首次实验演示并验证了忆阻神经-模糊硬件系统在无监督、有监督和迁移学习任务中的应用……
  • 直角照明轻触开关为复杂电子应用提 C&K Switches EITS系列直角照明轻触开关提供表面贴装 PIP 端子和标准通孔配置,为电信、数据中心和专业音频/视频设备等广泛应用提供创新的多功能解决方案。
  • 投身国产浪潮向上而行,英韧科技再获 投身国产浪潮向上而行,英韧科技再获“中国芯”认可
广告
热门推荐
广告
广告
广告
EE直播间
在线研讨会
广告
广告
广告
向右滑动:上一篇 向左滑动:下一篇 我知道了