一直处于超级隐身模式的一家硅谷初创公司声称他们重塑了神经网络数学计算,开发出一种互补型边缘AI芯片,并已经向客户发售样品,它并没有使用通常的大型乘法累加单元阵列。该公司最初的想法是将Xperi的传统图像和音频处理知识与机器学习相结合。

一家硅谷初创公司声称他们重塑了神经网络数学计算,开发出一种互补型边缘AI芯片。该芯片已经向客户发售样品,它并没有使用通常的大型乘法累加单元阵列。据这家公司称,该芯片的计算性能相当于4 TOPS,每瓦功耗可达55 TOPS/W。在低于20mW(以30fps运行YOLOv3测试)的功耗下,它可以达到数据中心级别的AI推理能力。

位于加州圣何塞的Perceive公司之前一直处于超级隐身模式。作为从Xperi独立出来的子公司,Perceive两年前正式成立,一直由其母公司出资支持。该团队有41人,Xperi内部也有一个类似规模的团队为该芯片开发应用。其创始CEO Steve Teig也是Xperi的CTO。他曾是Tabula的创始人兼CTO,Tabula是五年前倒闭的一家3D可编程逻辑初创公司;在此之前,他曾任Cadence CTO。

Teig解释道,他们最初的想法是将Xperi的传统图像和音频处理知识与机器学习相结合。 Xperi拥有DTS、IMAX Enhanced和HD Radio等品牌,其技术组合包括广泛应用于数码相机中处理红眼问题和图像稳定功能的图像处理软件,以及用于蓝光光盘播放器的音频处理软件。

 “我们从一张白纸开始,用信息论来思考:神经网络到底做了什么样的计算?是否有一种不同的方式来实现这种计算,以改变边缘计算能做的事情?” Teig说。“经过几年的努力,我们发现了它,然后我们决定……我们应该设计一款芯片来体现那些想法。”

Teig向Xperi董事会提出,成立一家新公司来开发这种芯片,在功率预算仅为20mW的边缘设备上进行有意义的AI推理。最终,这款名为Ergo的7x7mm芯片可以在没有外部RAM的情况下提供4 TOPS的计算性能(Teig解释道,实际上其性能相当于4 TOPS的GPU)。Ergo支持多种类型的神经网络,包括卷积网络(CNN)和递归网络(RNN),这与市场上针对CNN量身定制的许多解决方案形成了鲜明对比。Ergo甚至可以同时运行多个异构网络。

Teig说:“唯一限制我们可以运行多少个神经网络的因素是能够集成多少内存。”Perceive已演示了以6000或7000万个参数同时运行YOLOv3或M2Det,加上具有数百万个参数的ResNet 28,再加上进行语音和音频处理的LSTM或RNN。在具体应用中,这可能对应于同时进行图像和音频推理。

Perceive还声称Ergo芯片具有55 TOPS / W的超高能效。这个数字比一些竞争对手所声称的能效高出一个数量级。Perceiver的数据显示,它在以每秒30帧的速度运行YOLOv3(这是一个具有6400万个参数的大型网络)时功耗只要20mW。

Perceive声称其Ergo芯片的效率高达55 TOPS / W,以30fps的速度运行YOLOv3,功耗仅20mW(图片来源:Perceive)

这种高能效源于采用了一些激进的电源门控和时钟门控技术,它们充分利用了神经网络处理的确定性属性。与其它类型的代码不同,它没有分支,因此在编译时时序是已知的。Perceive因而可以精确地知道需要开启什么以及何时开启。

Teig说:“在电池供电的情况下,这种芯片可以断电,零毫瓦,还有微瓦级的运动传感器或模拟麦克风来检测可能感兴趣的东西。我们可以一觉醒来,就加载好一个庞大的数据中心级别的神经网络,并在大约50毫秒内运行它,包括解密。因此,我们只占用大约两帧视频的容量。”

但精心的硬件设计只是工作的一部分。

信息论

Teig说:“我们提出了一种不同的方式来表达所进行的计算本身及随之而来的算法,并以一种新的方式来表达网络本身,这才是我们的优势所在。”

Perceive以信息论为出发点(信息论是一个科学分支,它包括将信号与噪声区分开的数学方法),并使用其概念来研究从噪声中提取信号所需的计算量。Teig以一个目标检测网络为例进行了说明。

 “你将数百万个像素交给网络,只是想知道,这张照片中是否有一只狗?”Teig说。“图片中除了狗的信号,其它所有东西都是噪音。信息论可以使之量化,即你要知道多少才能确定图片中有一只狗,这真的可以通过数学方法使之精确确定。”

正如Teig所描述的那样,主流神经网络能够根据看到的许多狗的图片来进行归纳,因为它们至少可以发现噪声中的一些信号,但这是以经验法得到的,而不是严格的数学方法。这意味着信号会携带噪声,从而使主流神经网络变得非常庞大,并使它们容易受到对抗性例子和其它技巧的影响。

 “在确定哪些部分需要保留、哪些部分只是噪音时,你越能用数学方法处理,就越能做好归纳工作,因而其它方面的开销也就越少。” Teig说道。“我可以断言,即使是目前的神经网络也是从噪声中提取信号,它们没有以更加严谨的方式进行处理,因此承担了额外开销。”

这种信息论观点是Perceive机器学习策略的基础,这代表着一种新的神经网络处理方式。

“实际上,这是从信息理论视角体现机器学习与芯片完美结合的最佳案例。”Teig声称。

芯片架构

以Teig担任Tabula CTO的背景,你可能会认为这是一个基于可编程逻辑的硬件,然而事实并非如此。

 “十年来,我一直深受可编程逻辑的影响,如何构建丰富的互连体系结构以实现高性能的并行计算,因为FPGA上很多运算都是大规模并行的,而且在FPGA上计算和内存之间的交互也非常密集。”Teig说。“这无疑影响了我在Perceive的工作,但是我们所拥有的并不是可编程逻辑本身。我们受到的是这种思维方式的影响,但架构本身是围绕神经网络的。”

Perceive的神经网络结构具有可扩展性,初始芯片Ergo具有四个计算集,每个集都有自己的内存。尽管具体的细节仍在保密中,但Teig透露这些集群与其它AI加速器存在很大差异,其它AI加速器通常使用乘法累加单元(MAC)阵列来计算向量和矩阵的点积。

Perceive使用信息论的理念来重塑神经网络数学计算(图片:Perceive)

 “我们没有那样做。”Teig说:“我们没有采用MAC阵列。但结果是……我们的能效是市场上其它同类产品的20至100倍,原因是其他人都在做同一件事,而我们却没有。我们采用全新的方法演绎网络,才使我们能够实现如此高的效率。再加上机器学习技术,它可以发现网络的这种表示形式,以及训练网络使其兼容芯片想要看到的内容。”

图像和音频

Ergo可以支持两个摄像头,并包括一个图像处理单元,该单元可以作为预处理器来处理鱼眼镜头图像扭曲修正、伽玛校正、白平衡和裁剪之类的事情。

“这不是什么花哨的功能,但是用硬件实现预处理显然很有用,我们就在硬件上这么做了。” Teig说道。“而且我们也有等效的音频,例如,我们可以使用多个立体声麦克风实现波束成形。”

我们还提供一个带有DSP模块的Synopsis ARC微处理器,也可用于预处理;另外还提供一个Synopsis的安全模块。

 “我们还做了一件事,就是对所有内容进行绝对加密,以便在IoT环境中维持一定程度的安全。我们对网络进行加密,对微处理器上运行的代码进行加密,对接口进行加密,对所有内容加密。”Teig说。

该芯片为图像和音频外部的传感器提供合适I / O,并支持外部闪存和/或微处理器,可进行空中升级,用来更新芯片上加载的神经网络,或根据需要加载不同的网络。

Ergo可提供样品并随附参考板,预计在2020年第二季度实现量产。

(参考原文:Startup Reinvents Neural Network Maths, Launches 20mW Edge AI Chip

责编:Amy Guan

本文为《电子工程专辑》2020年5月刊杂志文章,版权所有,禁止转载。点击申请免费杂志订阅 

阅读全文,请先
您可能感兴趣
面对AI时代带来的差异化趋势、软件应用及开发时间长、软硬件协同难、高复杂度高成本等挑战,国产EDA仍需不断探索和创新。
股东诉讼指控英伟达的首席执行官黄仁勋隐藏了公司记录性收入增长主要由其旗舰产品GeForce GPU的挖矿销售驱动,而非游戏销售,导致投资者对公司的盈利来源和风险敞口产生错误认知。
今年初的GTC上,黄仁勋就说机器人的“ChatGPT时刻”要来了。也就是说这波AI驱动的机器人热潮要来了...最近的ROSCon China 2024大会似乎也能看到这种迹象...
近日,华为终端BG CEO何刚在和紫牛基金创始合伙人张泉灵的对话中表示,华为Mate 70系列每一颗芯片都有国产的能力。此外,日前在深圳宝安中学的一场讲座中,华为终端BG 董事长余承东也自豪地宣布Mate70实现了芯片的100%国产化。
华为Mate 70系列中的Mate 70搭载了麒麟9010芯片,而Mate 70 Pro/Pro+/RS则首发了麒麟9020芯片。近日,百万粉丝的网红博主@杨长顺维修家 对华为Mate 70 RS进行了拆解……
常情况下,英特尔的CEO在65岁时退休,而现年63岁的基辛格突然被退休,让市场感到意外。为了确保平稳过渡,英特尔董事会立即着手寻找新的CEO人选……
目前,智能终端NFC功能的使用频率越来越高,面对新场景新需求,ITMA多家成员单位一起联合推动iTAP(智能无感接近式协议)标准化项目,预计25年上半年发布1.0标准,通过功能测试、兼容性测试,确保新技术产业应用。
中科院微电子所集成电路制造技术重点实验室刘明院士团队提出了一种基于记忆交叉阵列的符号知识表示解决方案,首次实验演示并验证了忆阻神经-模糊硬件系统在无监督、有监督和迁移学习任务中的应用……
C&K Switches EITS系列直角照明轻触开关提供表面贴装 PIP 端子和标准通孔配置,为电信、数据中心和专业音频/视频设备等广泛应用提供创新的多功能解决方案。
投身国产浪潮向上而行,英韧科技再获“中国芯”认可
点击蓝字 关注我们安森美(onsemi)在2024年先后推出两款超强功率半导体模块新贵,IGBT模块系列——SPM31 IPM,QDual 3。值得注意的是,背后都提到采用了最新的FS7技术,主要性能
投资界传奇人物沃伦·巴菲特,一位94岁的亿万富翁,最近公开了他的遗嘱。其中透露了一个惊人的决定:他计划将自己99.5%的巨额财富捐赠给慈善机构,而只将0.5%留给自己的子女。这引起了大众对于巴菲特家庭
来源:观察者网12月18日消息,自12月2日美国发布新一轮对华芯片出口禁令以来,不断有知情人士向外媒透露拜登政府在卸任前将采取的下一步动作。美国《纽约时报》12月16日报道称,根据知情人士以及该报查阅
12月18 日,据报道,JNTC与印度Welspun BAPL就车载盖板玻璃的开发及量产签订了投资引进业务合作备忘录(MOU)。资料显示,JNTC是韩国的一家盖板玻璃厂商。Welspun的总部位于印度
阿里资产显示,随着深圳柔宇显示技术有限公司(下称:“柔宇显示”)旗下资产一拍以流拍告终,二拍将于12月24日开拍,起拍价为9.8亿元。拍卖标的包括位于深圳市龙岗区的12套不动产和一批设备类资产,其中不
 “ 担忧似乎为时过早。 ”作者 | RichardSaintvilus编译 | 华尔街大事件由于担心自动驾驶汽车可能取消中介服务,Uber ( NYSE: UBER ) 的股价在短短几周内从 202
扫描关注一起学嵌入式,一起学习,一起成长在嵌入式开发软件中查找和消除潜在的错误是一项艰巨的任务。通常需要英勇的努力和昂贵的工具才能从观察到的崩溃,死机或其他计划外的运行时行为追溯到根本原因。在最坏的情
在科技浪潮翻涌的硅谷,马克·扎克伯格不仅是“脸书”帝国的掌舵人,更是以其谦逊低调的形象,在公众心中树立了独特的领袖风范。然而,在镁光灯难以触及的私人领域,扎克伯格与39岁华裔妻子普莉希拉·陈的爱情故事
 “ AWS 的收入增长应该会继续加速。 ”作者 | RichardSaintvilus编译 | 华尔街大事件亚马逊公司( NASDAQ:AMZN ) 在当前水平上还有 38% 的上涨空间。这主要得益
今天上午,联发科宣布新一代天玑芯片即将震撼登场,新品会在12月23日15点正式发布。据悉,这场发布会联发科将推出全新的天玑8400处理器,这颗芯片基于台积电4nm制程打造,采用Arm Cortex A