神经网络加速器研发竞赛开始-电子工程专辑

 随着许多嵌入式系开始变得“智慧”且“自主”，以人工智能(AI)神经网络为导向的嵌入式系统市场即将起飞，神经网络加速器大战一触发…

嵌入式神经网络加速器市场持续升温，从智能音箱、无人机到智能灯泡等越来越多的系统准备在本地执行神经网络，以取代传送至云端进行运算的途径。

Movidius副总裁兼总经理Remi El-Ouazzane日前在接受《EE Times》访问时，将这个成长中的趋势定义为“让事情变得更智能与自主的一场竞赛”。
20170727-Movidius-1
Remi El-Ouzaane，Movidius副总裁兼总经理Remi El-Ouazzane

英特尔旗下子公司Movidius在上周推出了一款采用USB外形的独立式人工智能(AI)加速器。El-Ouazzane说，这款名为Movidius神经运算棒(Neural Compute Stick)的AI加速器设计，可轻松简单地插入Raspberry Pi或X86 PC，让大学研究人员、独立软件开发人员与程序增补人员易于为嵌入式系统进行编译、调整以及加速深度学习应用。

Movidius在去年秋天被英特尔收购后，如今已成为英特尔新技术部门的一部份。Movidius之前曾经开发出业界首款视觉处理器——Myriad 2 VPU。如今，El-Ouazzane表示，推出这款运算棒的最终目标在于让Movidius VPU成为可在边缘执行神经网络的“参考架构”。

20170727-Movidius-2
Movidius Myria 2 VPU方块图（来源：Intel/Movidius）

尽管目标远大，但业界分析师随即指出，Movidius Myriad 2 VPU当然不是嵌入式系统中可在边缘执行神经网络的唯一选择。

催生新产品类别：神经加速器

Tirias Research首席分析师Jim McGregor表示：“从技术上来看，您可以使用任何具有处理组件的开发板，并用于执行一种模型。例如机器学习(Machine learning)/AI模型已经执行于各种广泛的处理器和SoC了，特别是针对移动领域。”

高通(Qualcomm)以Snapdragon系列实现的影像辨识可说是最佳的例子。高通从Snapdragon 820开始采用自家开发的模型，McGregor说：“Snapdragon基本上就是推理引擎”。

具有平行处理组件(如GPU、DSP和FPGA)的处理解决方案非常适于作为推理引擎。McGregor解释说，许多正在开发中的客制化芯片解决方案都采用可内建于SoC的DSP或FPGA。

Linley Gwennap首席分析师Linley Gwennap对此表示赞同。他在最近出刊的《微处理器报告》(Microprocessor Report)中写道：高通、苹果(Apple)和英特尔(Movidius)都在“打造一种新的产品类别：神经加速器。”

Gwennap解释说，对于这些以客户端为基础的加速器需求来自于要求极低延迟的自动驾驶车。Gwennap在该报告的评论中指出，在本地进行处理的新技术将会开始“渗透至一些较低成本的应用”。他预测，“在消费设备中，小型的神经加速器可能是SoC中的一个重要区块，就像是绘图核心或图像处理器一样。几家知识产权(IP)供应商开始提供这一类加速器，期望尽可能地降低额外的硬件成本。”

Gwennap在《EE Times》的访谈中指出，Movidius Neural Compute Stick对于开发人员几乎没有什么不同。“对于开发人员来说，这并没什么了不起。典型的PC就能产生至少100GFLOPS，特别是如果它还内建绘图卡，直接在PC上进行开发会更好。对于需要较低功率处理器的嵌入式系统，高通Snapdragon 835提供超过250GOPS的效能，对于大多数的推理应用来说都够了。”
20170727-Movidius-3
（来源：Movidius）

不过，Movidius的El-Ouazzane并不赞同这样的看法。

首先，Movidius Neural Compute Stick利用USB让神经网络更易于存取，有利于制造商或程序增补人员用于开发深度神经网络原型或进行调整。

其次是电源效率的问题。El-Ouazzane指出，Movidius的解决方案可让神经网络在边缘运算时旳功耗小于2瓦(W)。

然后，还有成本的考虑。El-Ouazzane说：“我认为这是一个杀手级因素。Movidius Neural Compute Stick要价79美元，可望让神经网络的发展变得‘超级普遍’。”

他预期开发人员能使用Movidius的神经运算平台(Neural Compute Platform)应用程序编程接口(API)，“将经过训练的Caffe、前馈卷积神经网络(CNN)输入工具套件中，并进行配置，然后编译成一种可用于嵌入式部署的调整版本。”

以AI为导向的嵌入式应用？

随着许多嵌入式系开始变得“智慧”且“自主”，El-Ouazzane预计以AI为导向的嵌入式系统即将爆发。

但是，不久的将来即将出现什么样的AI设备？

McGregor预测，“我认为在2025年以前，每个人所接触的每一款新系统/平台都将具有某种程度的AI元素，它可能内建于设备本身，或存在于网络、云端，或是分散在其间。”

他补充说：“它可能就像是用户接口或应用一样简单，或者是像虚拟助理或自主控制般复杂的某种装。目前已经有许多应用已经导入了AI，包括虚拟助理、搜索引擎、财务建模、与文章写作.....等等。”

他说：“而在设备上，AI将因各种不同的原因而持续成长，特别是数据的安全、实时互动/处理以及带宽限制等。然而，在设备上进行训练才是真正的挑战，最终可能需要新的处理模型。”

英特尔想掌握一切…

当然，Movidus现在是英特尔的子公司，但其目标并不仅限于有更多嵌入式系统在边缘执行神经网络。El-Ouazzane将其产品发布架构在英特尔端对端AI产品组合的更大脉络之下。

他指出，英特尔拥有广泛的AI产品组合，并为其提供一整套完整的开发工具和资源。

“无论是在英特尔Nervana云端上训练AI神经网络、优化新兴的工作负载(如AI、、VR和AR)，以及使用英特尔Xeon Scalable处理器实现自动驾驶，或是以Movidius视觉处理器技术将AI导入边缘，”英特尔宣称该公司已为下一代AI驱动的产品和服务提供了全面的AI产品组合、工具、训练和部署选择。

然而，Movidus是否真的能在即将变得无所不在的AI嵌入式系统中成为其关键参考架构，目前还不而知。

Tirias Research的McGregor尽管认同Neural Compute Stick是“一款可在新设计中快速评估AI模型训练效能的有利工具，”但他仍指出，“设计人员仍然必须在最后的系统设计时间执行类测试，特别是如果他们并未使用Moviduis的芯片和/或Caffe架构。”

The Linley Group的Gwennap还认为，Movidius无法达到其目标——实现在边缘运算神经网络的嵌入式系统设计。

区隔推理引擎与训练

Gwennap指出，“值得注意的是，新的AI时代并不会有‘参考架构’。诸如TensorFlow和Caffe等架构将会把软件(神经网络)和硬件分开来。”他补充说：“映像到Myriad VPU的网络可以轻易地映像到Snapdragon或其他处理器上。因此，AI处理器将在性能和效率的基础上进行竞争，而不是锁定于指令集。”

同样地，他也不认同“同样的工具适用于训练和推理”的论点。Gwennap说：“一旦网络开始接受训练，就可以轻松地部署在支持主流架构的任何平台上。而且，主流的架构都是开放源码，以避免单一家厂商锁定。”

El-Ouazzane看好AI处理器抽取底层硬件的能力，它让设计者可将推论与练训分离开来。但他重申先前的观点，从长远来看，能够使用相同的工具进行神经网络的训练和部署，才有助于系统设计人员。

他以Movidius的开发蓝图为例表示，未来三年，深度学习的效能预计将会增加50倍。“为了在不增加功耗的情况下实现这一目标，我们可以在训练方面设计许多架构技巧。”El-Ouazzane补充说：“当你在斟酌这些技巧时，让学习和推理方面置于同一平台是至关重要的。”

编译：Susan Hong

EETC wechat barcode

关注最前沿的电子设计资讯，请关注“电子工程专辑微信公众号”。

阅读全文，请先

本文为EET电子工程专辑原创文章，禁止转载。请尊重知识产权，违者本司保留追究责任的权利。

Junko Yoshida

ASPENCORE全球联席总编辑，首席国际特派记者。曾任把口记者（beat reporter）和EE Times主编的Junko Yoshida现在把更多时间用来报道全球电子行业，尤其关注中国。她的关注重点一直是新兴技术和商业模式，新一代消费电子产品往往诞生于此。她现在正在增加对中国半导体制造商的报道，撰写关于晶圆厂和无晶圆厂制造商的规划。此外，她还为EE Times的Designlines栏目提供汽车、物联网和无线/网络服务相关内容。自1990年以来，她一直在为EE Times提供内容。

进入专栏

人工智能 EDA/IP/IC设计处理器/DSP FPGAs/PLDs 业界新闻

返回列表

上一篇： Qualcomm开发者网络将提供骁龙神经处理引擎软件开发包 下一篇： 支持硬件创新不遗余力，想创业如此活动都不参加就真是你的错了

AWS计划追加100亿美元投资，在美国俄亥俄州扩建数据中心近年来，AWS还积极投资于人工智能（AI）、机器学习（ML）、大数据分析和边缘计算等前沿技术，以保持其在这些领域的竞争优势。
马斯克刷新世界首富记录：身家超过4000亿美元，未来看涨万亿美元有鉴于电动汽车、自动驾驶和人工智能业务等未来增长潜力，以及在马斯克在当选总统特朗普政府中的“特殊地位”，多家分析机构认为，马斯克的财富未来还将进一步增长。
马斯克亲自洽谈，xAI以10亿美元获英伟达GB200服务器优先交付权据悉，此次交易是通过马斯克亲自与英伟达CEO黄仁勋进行沟通促成的。这批GB200 AI芯片将被用于强化其旗舰级超级计算集群——Colossus（巨人）。Colossus作为xAI的技术基石，将借此机会实现计算能力的飞跃。
因应人工智能需求增长，中国有色矿业将3.4亿美元收购巴西锡矿公司股份锡作为AI技术生产的重要原料之一，其需求有望成为新的增长点。而中国有色矿业公司也希望锁定这种在关键矿物清单上占据重要地位的锡的供应。
HBM4量产时间提前，特斯拉向SK海力士、三星表达采购HBM4意向 HBM4将用于特斯拉正在开发的AI数据中心及其自动驾驶汽车。其中，特斯拉采购HBM4芯片将用于强化其超级电脑Dojo的性能。
特朗普或放宽自动驾驶汽车限制，特斯拉“完全无人驾驶”步入快车道如果新的法规能够实施，特斯拉毫无疑问将能够更自由地部署其无人驾驶技术，从而推动无人驾驶出租车（如Cybercab）的大规模生产。
“一碰交互，共触未来”ITMA峰会盛大目前，智能终端NFC功能的使用频率越来越高，面对新场景新需求，ITMA多家成员单位一起联合推动iTAP（智能无感接近式协议）标准化项目，预计25年上半年发布1.0标准，通过功能测试、兼容性测试，确保新技术产业应用。
中科院微电子所在忆阻神经-模糊硬中科院微电子所集成电路制造技术重点实验室刘明院士团队提出了一种基于记忆交叉阵列的符号知识表示解决方案，首次实验演示并验证了忆阻神经-模糊硬件系统在无监督、有监督和迁移学习任务中的应用……
直角照明轻触开关为复杂电子应用提 C&K Switches EITS系列直角照明轻触开关提供表面贴装 PIP 端子和标准通孔配置，为电信、数据中心和专业音频/视频设备等广泛应用提供创新的多功能解决方案。
投身国产浪潮向上而行，英韧科技再获投身国产浪潮向上而行，英韧科技再获“中国芯”认可

投资20亿！路芯半导体掩膜版生产项目首批工艺设备机台入厂来源：苏州工业园区12月17日，江苏路芯半导体技术有限公司掩膜版生产项目迎来重要进展——首批工艺设备机台成功搬入。路芯半导体自2023年成立以来，专注于半导体掩膜版的研发与生产，掌握130nm至28n
雷曼光电与辰显光电签约，推进MicroLED商业化 ‍‍12月18日，深圳雷曼光电科技股份有限公司（下称“雷曼光电”）与成都辰显光电有限公司（下称“辰显光电”）在成都正式签署战略合作协议。双方将充分发挥各自在技术创新、产品研发等方面的优势，共同推进Mi
拜登拟对成熟制程芯片启动301调查来源：观察者网12月18日消息，自12月2日美国发布新一轮对华芯片出口禁令以来，不断有知情人士向外媒透露拜登政府在卸任前将采取的下一步动作。美国《纽约时报》12月16日报道称，根据知情人士以及该报查阅
撒贝宁走进维信诺，探寻“非凡中国屏”诞生背后的科技传奇之旅万物互联的时代浪潮中，以OLED为代表的新型显示技术，已成为人机交互、智能联结的重要端口。维信诺作为中国OLED赛道的先行者和引领者，凭借自主创新，实现了我国OLED技术的自立自强，成为中国新型显示产
又输了！《黑神话：悟空》年度最佳PS5游戏败给《宇宙机器人》 2024年度PlayStation游戏奖今日公布，《宇宙机器人》获得年度最佳PS5游戏，《使命召唤：黑色行动6》获得年度最佳PS4游戏。在这次评选中，《宇宙机器人》获得多个奖项，包括最佳艺术指导奖、最
AI日报丨超级AI独角兽来了！拿下100亿美元融资，估值升至620亿美元 “ 洞悉AI，未来触手可及。”整理 | 美股研究社在这个快速变化的时代，人工智能技术正以前所未有的速度发展，带来了广泛的机会。《AI日报》致力于挖掘和分析最新的AI概念股公司和市场趋势，为您提供深度的
自动驾驶业务增长6倍，Uber被市场明显错杀，即将迎来50%上涨空间！ “ 担忧似乎为时过早。 ”作者 | RichardSaintvilus编译 | 华尔街大事件由于担心自动驾驶汽车可能取消中介服务，Uber ( NYSE: UBER ) 的股价在短短几周内从 202
高科视像、新视通等持续扩大COB产能近期，高科视像、新视通、江苏善行智能科技等企业持续扩充COB产能。插播：加入LED显示行业群，请加VX：hangjia188■ 高科视像：MLED新型显示面板生产项目（二期）招标12月18日，山西高科
扎克伯格39岁华裔爱妻罕见炫舞，丰韵身姿尽显“女王”气场，宠溺深情令人动容在科技浪潮翻涌的硅谷，马克·扎克伯格不仅是“脸书”帝国的掌舵人，更是以其谦逊低调的形象，在公众心中树立了独特的领袖风范。然而，在镁光灯难以触及的私人领域，扎克伯格与39岁华裔妻子普莉希拉·陈的爱情故事
REDMI全球首发！联发科天玑8400官宣：挑战高通骁龙8系今天上午，联发科宣布新一代天玑芯片即将震撼登场，新品会在12月23日15点正式发布。据悉，这场发布会联发科将推出全新的天玑8400处理器，这颗芯片基于台积电4nm制程打造，采用Arm Cortex A

热门评论
最新评论

换一换

神经网络加速器研发竞赛开始

杂志声明