 在过去的2016年，在计算机产业来说，相信没有一个概念比人工智能更热门。跨入2017年，专家们表示，人工智能生态圈的需求增长会更加迅猛。主要集中在为深度神经网络找寻性能和效率更适合的“引擎”。

在过去的2016年，在计算机产业来说，相信没有一个概念比人工智能更热门。跨入2017年，专家们表示，人工智能生态圈的需求增长会更加迅猛。主要集中在为深度神经网络找寻性能和效率更适合的“引擎”。

现在的深度学习系统依赖于软件定义网络和大数据学习产生的超大型运算能力，并靠此来实现目标。但很遗憾的是，这类型的运算配置是很难嵌入到那些运算能力、存储大小、和带宽都有限制的系统中（例如汽车、无人机和物联网设备）。

这就给业界提出了一个新的挑战，如何通过创新，把深度神经网络的运算能力嵌入到终端设备中去。

Movidius公司的CEO Remi El-Ouazzane在几个月前说过，将人工智能摆在网络的边缘将会是一个大趋势。

在问到为什么人工智能会被“赶”到网络边缘的时候，CEA Architecture Fellow Marc Duranton给出了三个原因：分别是安全、隐私和经济。他认为这三点是驱动业界在终端处理数据的重要因素。他指出，未来将会衍生更多“将数据转化为信息”的需求。并且这些数据越早处理越好，他补充说。
marc-duranton 200
CEA Architecture Fellow Marc Duranton

设想一下，假如你的无人驾驶汽车是安全的，那么这些无人驾驶功能就不需要长时间依赖于联盟处理；假设老人在家里跌倒了，那么这种情况当场就应该检测到并判断出来。考虑到隐私原因，这些是非常重要的，Duranton强调。

但这并不意味着收集家里十个摄像头的所有图片，并传送给我，就称作一个号的提醒。这也并不能降低“能耗、成本和数据大小”，Duranton补充说。

竞赛正式开启

从现在的情景看来，芯片供应商已经意识到推理机的增长需求。包括Movidus (Myriad 2), Mobileye (EyeQ 4 & 5) 和Nvidia (Drive PX)在内的众多半导体公司正在角逐低功耗、高性能的硬件加速器。帮助开发者更好的在嵌入式系统中执行“学习”。

从这些厂商的动作和SoC的发展方向看来，在后智能手机时代，推理机已经逐渐成为半导体厂商追逐的下一个目标市场。

在今年早些时候，Google的TPU横空出世，昭示着业界意图在机器学习芯片中推动创新的的意图。在发布这个芯片的时候，搜索巨人表示，TPU每瓦性能较之传统的FPGA和GPU将会高一个数量级。Google还表示，这个加速器还被应用到了今年年初风靡全球的AlphaGo系统里面。

但是从发布到现在，Google也从未披露过TPU的具体细节，更别说把这个产品对外出售。

很多SoC从业者从谷歌的TPU中得出了一个结论，他们认为，机器学习需要定制化的架构。但在他们针对机器学习做芯片设计的时候，他们又会对芯片的架构感到怀疑和好奇。同时他们想知道业界是否已经有了一种衡量不同形态下深度神经网络（DNN）性能的工具。

工具已经到来

CEA声称，他们已经为帮推理机探索不同的硬件架构做好了准备，他们已经开发出了一个叫做N2D2,的软件架构。他们够帮助设计者探索和声称DNN架构。“我们开发这个工具的目的是为了帮助DNN选择适合的硬件”，Duranton说。到2017年第一季度，这个N2D2会开源。Duranton承诺。

N2D2的特点在于不仅仅是在识别精度的基础上对比硬件，它还能从处理时间、硬件成本和能源损耗的多个方面执行对比。因为针对不同的深度学习应用，其所需求的硬件配置参数都是不一样的，所以说以上几点才是最重要的，Duranton表示。
N2D2 421
N2D2的工作原理

N2D2为现存的CPU、GPU和FPGA提供了一个参考标准。

边缘计算的障碍

作为一个资深的研究组织，CEA已经在如何把DNN完美的推广到边缘计算领域进行了长时间的深入研究。在问到执行这种推进的障碍时，Duranton指出，由于功耗、尺寸和延迟的限制，这些“浮点”服务器方案不能应用。这就是最大的障碍。而其他的障碍包括了“大量的Mac、带宽和芯片上存储的尺寸”，Duranton补充说。

那就是说如何整合这种“浮点”方式，是最先应该被解决的问题。
Duranton认为，一些新的架构是在所难免的，随之而来的一些类似“spike code”的新coding也是必然的。

经过CEA的研究指出，甚至二进制编码都不是必须的。他们认为类似spike coding这类的时间编码在边缘能够迸发出更强大的能量。

Spike coding之所以受欢迎，是因为它能明确展示神经系统内的数据解码。往深里讲，就是说这些基于事件的的编码能够兼容专用的传感器和预处理。

这种和神经系统极度相似的编码方式使得混合模拟和数字信号更容易实现，这也能够帮助研究者打造低功耗的硬件加速器。

CEA也正在思考把神经网络架构调整到边缘计算的潜在可能。Duranton指出，现在人们正在推动使用‘SqueezeNet取替AlexNet。据报道，为达到同等精度，使用前者比后者少花50倍的参数。这类的简单配置对于边缘计算、拓扑学和降低Mac的数量来说，都是很重要的。

Duranton认为，从经典的DNN转向嵌入式网络是一种自发的行为。

P-Neuro，一个临时的芯片

CEA的野心是去开发一个神经形态的电路。研究机构认为，在深度学习中，这样的一个芯片是推动把数据提取放在传感器端的一个有效补充。
但在达到这个目标之前，CEA相处了很多权宜之计。例如开发出D2N2这样的工具，帮助芯片开发者开发出高TOPS的DNN解决方案。

而对于那些想把DNN转移到边缘计算的玩家来说，他们也有相对应的硬件去实现。这就是CEA提供的低功耗可编程加速器——P-Neuro。现行的P-Neuro芯片是基于FPGA开发的。但Duranton表示，他们已经把这个FPAG变成了一个ASIC。
Pneuro demo
和嵌入式CPU对比的P-Neuro demo

在CEA的实验室，Duranton他们已经在这个基于FPAG的P-Neuro搭建了一个面部识别的卷积神经网络（CNN）。这个基于 P-Neuro的Demo和嵌入式CPU做了对比。（树莓派、带有三星Exynos处理器的安卓设备）。他们同样都运行相同的CNN应用。他们都安排去从18000个图片的数据库中去执行“人脸特征提取”。

根据示例展示，P-Neuro的速度是6942张图片每秒，而功耗也只是2776张图每瓦。
Pneuro table
P-Neuro和GPU、CPU的对比 (Source: CEA)

如图所示，和Tegra K1相比，基于FPGA的P-Neuro在100Mhz工作频率的时候，工作更快，且功耗更低。

P-Neuro是基于集群的SIMD架构打造，这个架构是以优化的分级存储器体系和内部连接被大家熟知的。
Pneuro 421
P-Neuro的框图

对于CEA的研究者来说，P-Neuro 只是一个短期方案。现行的 P-Neuro 是在一个CMOS设备上打造的，使用的是二进制编码。他们团队正在打造一个全CMOS方案，并打算用spike coding。

为了充分利用先进设备的优势，并且打破密度和功率的问题，他们团队设立了一个更高的目标。他们考虑过把RRAM当做突触元素，还考虑过FDSOI和纳米线这样的制程。

在一个“EU Horizon 2020”的计划里面，他们希望做出一个神经形态架构的芯片，能够支持最先进的机器学习。同时还是一个基于spike的学习机制。

Neuromorphic处理器

这就是一个叫做NeuRAM3的项目。届时，他们的芯片会拥有超低功耗、尺寸和高度可配置的神经架构。他们的目标是较之传统方案，打造一个能将功耗降低50倍的产品。
neuromorphic-processor Giacomo-Indiveri
Neuromorphic处理器
neuromorphic-processor-spec
Neuromorphic处理器的基本参数

据介绍，这个方案包含了基于FD-SOI工艺的整体集成的3D技术，另外还用到的RRAM来做突触元素。在NeuRAM3项目之下，这个新型的混合信号多核神经形态芯片设备较之IBM的TrueNorth，能明显降低功耗。
TrueNorth-Comparison 421
与IBM的TrueNorth对比(Source: NeuRAM3)

而NeuRAM3项目的参与者包括了IMEC, IBM Zurich, ST Microelectronics, CNR (The National Research Council in Italy), IMSE (El Instituto de Microelectrónica de Sevilla in Spain), 苏黎世大学和德国的雅各布大学。

EETC wechat barcode

关注最前沿的电子设计资讯，请关注“电子工程专辑微信公众号”。

阅读全文，请先

本文为EET电子工程专辑原创文章，禁止转载。请尊重知识产权，违者本司保留追究责任的权利。

Junko Yoshida

ASPENCORE全球联席总编辑，首席国际特派记者。曾任把口记者（beat reporter）和EE Times主编的Junko Yoshida现在把更多时间用来报道全球电子行业，尤其关注中国。她的关注重点一直是新兴技术和商业模式，新一代消费电子产品往往诞生于此。她现在正在增加对中国半导体制造商的报道，撰写关于晶圆厂和无晶圆厂制造商的规划。此外，她还为EE Times的Designlines栏目提供汽车、物联网和无线/网络服务相关内容。自1990年以来，她一直在为EE Times提供内容。

进入专栏

模拟/混合信号业界新闻 EDA/IP/IC设计处理器/DSP 人工智能存储技术市场分析

返回列表

上一篇： 为蜂窝基站设计更高效的宽带100W Doherty功放 下一篇： 逆势成长三成，平板方案商亿道转型很成功

安森美65纳米Treo平台，给模拟混合信号技术带来了什么？ Treo是一个统一的、模块化的、可裁剪的平台，可以根据用户的不同需求、功能和应用，快速的提供本地智能化和计算功能，实现灵活配置，并显著提高终端应用的性能和精度。
芯联集成拟全资持有芯联越州，作价58.97亿元收购剩余72.33%股权按照芯联集成的说法，这次并购的主要目的是增强芯联集成对芯联越州的控制力，并利用上市公司的技术、客户和资金优势，重点支持碳化硅、高压模拟IC等新兴业务的发展。
晶圆级脉冲激光沉积将改变游戏规则一项技术要想产生广泛的影响，它不仅要解决短期的挑战，还应该超越现有技术的进步，为未来的创新打开大门。这就是我们对泛林集团(Lam Research)今年早些时候推出的全球首个用于半导体量产的脉冲激光沉积(PLD)技术的描述。
德州仪器将获16亿美元政策补贴，扩大130nm-28nm工艺规模这笔"芯片法案"补贴资金将专门用于支持德州仪器的三座300mm晶圆厂的建设。包括位于德克萨斯州谢尔曼的SM晶圆厂的两期工程（该工厂最终将包括四期工程）和位于犹他州Lehi晶圆厂一个阶段工程。
诺基亚宣布将以23亿美元收购英飞朗，扩大光网络业务版图收购完成后，诺基亚和英飞朗将通过整合双方的技术和市场资源来提高其在光网络领域的地位，尤其是在北美市场。而诺基亚将利用英飞朗的技术优势来提升其在光网络领域的竞争力，并进一步巩固其在全球市场的地位。预计，此次收购将使诺基亚光网络业务的规模增加75%。
国内这家毫米波雷达公司如何做到20%市占率的？前不久的Calterah Day加特兰日活动上，加特兰微电子创始人兼CEO陈嘉澍说，今年加特兰汽车毫米波雷达芯片在国内的市场份额达到20%。这是怎么做到的？...
“一碰交互，共触未来”ITMA峰会盛大目前，智能终端NFC功能的使用频率越来越高，面对新场景新需求，ITMA多家成员单位一起联合推动iTAP（智能无感接近式协议）标准化项目，预计25年上半年发布1.0标准，通过功能测试、兼容性测试，确保新技术产业应用。
中科院微电子所在忆阻神经-模糊硬中科院微电子所集成电路制造技术重点实验室刘明院士团队提出了一种基于记忆交叉阵列的符号知识表示解决方案，首次实验演示并验证了忆阻神经-模糊硬件系统在无监督、有监督和迁移学习任务中的应用……
直角照明轻触开关为复杂电子应用提 C&K Switches EITS系列直角照明轻触开关提供表面贴装 PIP 端子和标准通孔配置，为电信、数据中心和专业音频/视频设备等广泛应用提供创新的多功能解决方案。
投身国产浪潮向上而行，英韧科技再获投身国产浪潮向上而行，英韧科技再获“中国芯”认可

项目动态|长飞先进武汉基地首批设备搬入今日，长飞先进武汉基地建设再次迎来新进展——项目首批设备搬入仪式于光谷科学岛成功举办，长飞先进总裁陈重国及公司主要领导、嘉宾共同出席见证。对于半导体行业而言，厂房建设一般主要分为四个阶段：设备选型、设
跟着撒贝宁走进维信诺，探寻“非凡中国屏”诞生背后的科技传奇之旅万物互联的时代浪潮中，以OLED为代表的新型显示技术，已成为人机交互、智能联结的重要端口。维信诺作为中国OLED赛道的先行者和引领者，凭借自主创新，实现了我国OLED技术的自立自强，成为中国新型显示产
AI日报丨超级AI独角兽来了！拿下100亿美元融资，估值升至620亿美元 “ 洞悉AI，未来触手可及。”整理 | 美股研究社在这个快速变化的时代，人工智能技术正以前所未有的速度发展，带来了广泛的机会。《AI日报》致力于挖掘和分析最新的AI概念股公司和市场趋势，为您提供深度的
高科视像、新视通等持续扩大COB产能近期，高科视像、新视通、江苏善行智能科技等企业持续扩充COB产能。插播：加入LED显示行业群，请加VX：hangjia188■ 高科视像：MLED新型显示面板生产项目（二期）招标12月18日，山西高科
注意些问题，嵌入式软件代码可大幅度减少bug 扫描关注一起学嵌入式，一起学习，一起成长在嵌入式开发软件中查找和消除潜在的错误是一项艰巨的任务。通常需要英勇的努力和昂贵的工具才能从观察到的崩溃，死机或其他计划外的运行时行为追溯到根本原因。在最坏的情
巨头疲软行业内卷，极越为谁而“亡”？在上海嘉定叶城路1688号的极越办公楼里，最显眼的位置上，写着一句话：“中国智能汽车史上，必将拥有每个极越人的名字。”本以为这句话是公司的企业愿景，未曾想这原来是命运的嘲弄。毕竟，极越用一种极其荒唐的
面板大厂引入AI，每年节省10亿！ LG Display 12月18日表示，为加强OLED制造竞争力，自主开发并引进了“AI（人工智能）生产体系”。“AI生产体系”是AI实时收集并分析OLED工艺制造数据的系统。LG Display表
开讲在即|TI模拟+嵌入式处理器产品技术方案助力新能源系统设计，提升系统稳定性与可靠性点击蓝字关注我们电网和可再生能源系统向着更智能、更高效的方向发展助力优化能源分配构建更加绿色和可靠的能源未来12 月 24 日上午 9:30 - 11:302024 德州仪器新能源基础设施技术直播
【倒计时3天】2024RT-Thread开发者大会，本周六见！亲爱的企业用户和开发者朋友们距离2024 RT-Thread开发者大会正式开幕仅剩最后3天！还没报名的小伙伴，抓紧报名噢，12月21日不见不散！大会时间与地点时间：2024年12月21日 9:30-1
“基因筛选式生娃”的马斯克：3任妻子，11个娃9个是试管，还在公司“选妃捐精”？上个月，亿万富翁埃隆·马斯克谈到了年轻一代的生育问题。他强调生育的紧迫性，认为无论面临何种困难，生育后代都是必要的，否则人类可能会在无声中走向消亡。他认为人们对于生育的担忧有些过头，担心经济压力等问题

热门评论
最新评论

换一换

选手入场，人工智能芯片竞赛开启！

竞赛正式开启

工具已经到来

边缘计算的障碍

P-Neuro，一个临时的芯片

Neuromorphic处理器

杂志声明