IBM的AI芯片能否重塑深度学习推理？-电子工程专辑



 0

 收藏

 分享

扫码分享到微信好友

 扫一扫

扫码查看更多文章

IBM的一款新型模拟内存芯片证明了AI运算可同时兼顾性能和能效。

去年8月，由30名IBM研究实验室科学家组成的团队推出了一款全新芯片，旨在大幅提高高能耗深度学习推理的能效，同时保持运算精度。这款名为Hermes的模拟内存芯片将数字电路与相变内存(PCM)结合在一起，这样神经网络的计算就可以在内存电路中进行。

这种处理器与内存的搭配无需像典型的人工智能加速器芯片那样，在内存和处理单元之间无休止地移动大量数据。重要的是，分析表明，该芯片在执行计算机视觉人工智能任务时与数字芯片一样出色，而功耗却低得多。

率先推出该芯片的IBM欧洲研究院团队负责人Abu Sebastian及其同事Manuel Le Gallo-Bourdeau和Vijay Narayanan在其博客中明确表示，他们现在已经展示了实现快速、低功耗模拟人工智能芯片架构愿景所需的许多构件。正如该团队的一位IBM科学家告诉笔者的那样，“我们仍处于芯片的研究阶段，但我们现在要尽可能多地构建硬件，以准确了解它的功能，并找出向前推进的最佳方法”。(编者注：这位科学家接受了我们的采访，但要求不公开身份。)

耗电的人工智能

人工智能的功耗问题源于一种被称为冯·诺依曼瓶颈的现象，这一瓶颈以现代计算机架构的先驱约翰·冯·诺依曼的名字命名。在这种情况下，CPU和内存是独立的实体，因此数据和计算必须在两者之间不断来回穿梭。这一过程会产生瓶颈，因为处理速度通常比检索数据或将数据写入内存的速度更快。

长期以来，设计人员一直在使用内存缓存、流水线和分层内存方案等变通方法来解决瓶颈问题。最近，芯片巨头们专门开发了加速器芯片来承担新兴的人工智能处理任务。例如，NVIDIA已经从其GPU技术中取得了长足的进步；谷歌开发了张量处理单元；英特尔提供了多种解决方案，包括可针对人工智能计算进行编程的FPGA；高通则为移动设备设计了人工智能加速器芯片。

尽管如此，人工智能的高能耗需求及其不断增加的运算量要求采用更节能的方法，而这正是模拟内存计算将发挥关键作用的地方。

模拟内存芯片可以直接在内存中执行计算，从而规避冯·诺依曼瓶颈。模拟计算方案只需要几个电阻器或电容器，因此可以将它们移到内存中，消除内存和处理器之间的分离，从而提高能效，远远超过数字芯片。

IBM在其最新的模拟人工智能芯片中采用了这种方法。该芯片采用14nm CMOS设计和制造，包含64个计算内核，每个内核都有自己的PCM阵列，以及一个轻型数字处理器，用于激活和累加等额外的神经网络运算(如图所示)。片上通信网络将这些内核连接在一起，芯片中心的另一个数字处理单元可以处理要求更高的神经网络计算。

图：IBM模拟AI芯片的渲染图。(来源：IBM 研究实验室)

尽管IBM使用PCM技术使其与众不同，但在模拟AI芯片领域，IBM并非孤军奋战。例如，英特尔实验室的研究人员一直在研究静态随机存取存储器和其他技术；美国初创公司Mythic专注于多级闪存；斯坦福大学、圣母大学、加州大学圣地亚哥分校和清华大学的研究人员开发了一种神经形态芯片，被称为NeuRRAM，它使用电阻式随机存取存储器。

对于IBM来说，PCM是一个合乎逻辑的选择，因为该公司已经花了至少十年的时间为存储应用开发这种材料，其中包括多电平PCM芯片。PCM本身是一种非易失性随机存取存储器，加热时会在低导电非晶相和高导电晶相之间切换。基于这些材料的器件可以利用相变，将电导的变化编码为突触权重，然后用于计算操作。重要的是，正如IBM的最新结果所示，记录这种连续值(而不仅仅是数字器件的1或0)对于深度神经网络运算非常有效。

在与其他基于类似技术的芯片(包括NeuRRAM以及Mythic和TSMC开发的芯片)进行基准测试时，IBM的技术可以在能效相当的情况下，将矩阵向量乘法(人工智能运算的基础)的执行速度至少提高15倍。值得注意的是，在使用人工智能训练用彩色图像数据库CIFAR-10进行测试时，该芯片在图像识别方面的准确度也高于其他芯片，这对模拟内存计算虽然节能但容易出现计算误差的观念提出了挑战。

“相变存储器的优势在于它足够稳定，可以进行一些相对准确的计算。”这位IBM科学家表示，“我们已经开发出准确编程的技术，并对误差进行了详细表征。我们的准确度足以满足神经网络的要求。”

英特尔实验室研究科学家Hechen Wang多年来也一直从事模拟内存计算的研究，他也认为这种方法可以实现卓越的能效。“研究人员大约在五年前开始研究模拟内存，现在我们有IBM、imec、GlobalFoundries、台积电和三星等公司和学术团体开始研究这项技术。”他表示，“如果我们想要进行非常高效的AI计算，就需要将处理单元置于内存阵列内部，甚至是内存单元内部。

“英特尔实验室正在寻求内存计算的多种途径，并探索一系列内存技术。至于哪种内存才是正确的方向，我们还没有得出结论。”

尽管如此，Wang仍然认为，IBM和其他公司最新的模拟内存开发成果正在对这一“热门”领域产生积极影响。“IBM的研究成果已经发表在Nature杂志上，说实话，我做梦也没想到会发生这样的事情。”他表示，“很多人会阅读这些刊物，我希望这些结果能够打开他们的思路，吸引更多的人关注这一领域。”

下一步

自从在Nature Electronics杂志上发表研究结果以来，IBM欧洲公司的研究人员已经明确表示，他们相信自己的工作证明了模拟AI可以提供必要的计算精度，与传统的数字加速器相媲美，而且能效更高。随着人工智能技术的兴起，节能又准确的推理硬件变得至关重要，研究人员的目标是创造出能够执行端到端推理运算的模拟内存芯片。

与此同时，IBM欧洲研究院告诉笔者，它打算利用PCM器件上可达到的高突触密度，制造出能够运行整个网络操作的大型芯片，以超越数字加速器竞品。

“一旦我们真正展示了这项技术的前景，并且有更多的人愿意在这一领域投资，那么我们就可以组建多支由数百名研究人员组成的团队来从事这项工作，从而使芯片投入生产模式。”这位IBM科学家表示，“所以现在，我们将继续努力。”

（原文刊登于EE Times欧洲版，参考链接：Could IBM's AI Chip Reinvent Deep Learning Inference?，由Franklin Zhao编译。）

责编：Franklin

本文为EET电子工程专辑原创文章，禁止转载。请尊重知识产权，违者本司保留追究责任的权利。

阅读全文，请先

人工智能处理器/DSP 存储技术模拟/混合信号市场分析业界新闻

您可能感兴趣

AWS计划追加100亿美元投资，在美国俄亥俄州扩建数据中心

近年来，AWS还积极投资于人工智能（AI）、机器学习（ML）、大数据分析和边缘计算等前沿技术，以保持其在这些领域的竞争优势。

马斯克刷新世界首富记录：身家超过4000亿美元，未来看涨万亿美元

有鉴于电动汽车、自动驾驶和人工智能业务等未来增长潜力，以及在马斯克在当选总统特朗普政府中的“特殊地位”，多家分析机构认为，马斯克的财富未来还将进一步增长。

马斯克亲自洽谈，xAI以10亿美元获英伟达GB200服务器优先交付权

据悉，此次交易是通过马斯克亲自与英伟达CEO黄仁勋进行沟通促成的。这批GB200 AI芯片将被用于强化其旗舰级超级计算集群——Colossus（巨人）。Colossus作为xAI的技术基石，将借此机会实现计算能力的飞跃。

因应人工智能需求增长，中国有色矿业将3.4亿美元收购巴西锡矿公司股份

锡作为AI技术生产的重要原料之一，其需求有望成为新的增长点。而中国有色矿业公司也希望锁定这种在关键矿物清单上占据重要地位的锡的供应。

HBM4量产时间提前，特斯拉向SK海力士、三星表达采购HBM4意向

HBM4将用于特斯拉正在开发的AI数据中心及其自动驾驶汽车。其中，特斯拉采购HBM4芯片将用于强化其超级电脑Dojo的性能。

特朗普或放宽自动驾驶汽车限制，特斯拉“完全无人驾驶”步入快车道

如果新的法规能够实施，特斯拉毫无疑问将能够更自由地部署其无人驾驶技术，从而推动无人驾驶出租车（如Cybercab）的大规模生产。

“一碰交互，共触未来”ITMA峰会盛大开启近场交互新生态

目前，智能终端NFC功能的使用频率越来越高，面对新场景新需求，ITMA多家成员单位一起联合推动iTAP（智能无感接近式协议）标准化项目，预计25年上半年发布1.0标准，通过功能测试、兼容性测试，确保新技术产业应用。

中科院微电子所在忆阻神经-模糊硬件及应用探索方面取得新进展

中科院微电子所集成电路制造技术重点实验室刘明院士团队提出了一种基于记忆交叉阵列的符号知识表示解决方案，首次实验演示并验证了忆阻神经-模糊硬件系统在无监督、有监督和迁移学习任务中的应用……

直角照明轻触开关为复杂电子应用提供定制性和多功能性

C&K Switches EITS系列直角照明轻触开关提供表面贴装 PIP 端子和标准通孔配置，为电信、数据中心和专业音频/视频设备等广泛应用提供创新的多功能解决方案。

投身国产浪潮向上而行，英韧科技再获“中国芯”认可

雷曼光电与辰显光电签约，推进MicroLED商业化

‍‍12月18日，深圳雷曼光电科技股份有限公司（下称“雷曼光电”）与成都辰显光电有限公司（下称“辰显光电”）在成都正式签署战略合作协议。双方将充分发挥各自在技术创新、产品研发等方面的优势，共同推进Mi

跟着撒贝宁走进维信诺，探寻“非凡中国屏”诞生背后的科技传奇之旅

万物互联的时代浪潮中，以OLED为代表的新型显示技术，已成为人机交互、智能联结的重要端口。维信诺作为中国OLED赛道的先行者和引领者，凭借自主创新，实现了我国OLED技术的自立自强，成为中国新型显示产

撒贝宁走进维信诺，探寻“非凡中国屏”诞生背后的科技传奇之旅

JNTC宣布在印度开发和量产车载盖板玻璃

12月18 日，据报道，JNTC与印度Welspun BAPL就车载盖板玻璃的开发及量产签订了投资引进业务合作备忘录（MOU）。资料显示，JNTC是韩国的一家盖板玻璃厂商。Welspun的总部位于印度

又输了！《黑神话：悟空》年度最佳PS5游戏败给《宇宙机器人》

2024年度PlayStation游戏奖今日公布，《宇宙机器人》获得年度最佳PS5游戏，《使命召唤：黑色行动6》获得年度最佳PS4游戏。在这次评选中，《宇宙机器人》获得多个奖项，包括最佳艺术指导奖、最

注意些问题，嵌入式软件代码可大幅度减少bug

扫描关注一起学嵌入式，一起学习，一起成长在嵌入式开发软件中查找和消除潜在的错误是一项艰巨的任务。通常需要英勇的努力和昂贵的工具才能从观察到的崩溃，死机或其他计划外的运行时行为追溯到根本原因。在最坏的情

扎克伯格39岁华裔爱妻罕见炫舞，丰韵身姿尽显“女王”气场，宠溺深情令人动容

在科技浪潮翻涌的硅谷，马克·扎克伯格不仅是“脸书”帝国的掌舵人，更是以其谦逊低调的形象，在公众心中树立了独特的领袖风范。然而，在镁光灯难以触及的私人领域，扎克伯格与39岁华裔妻子普莉希拉·陈的爱情故事

REDMI全球首发！联发科天玑8400官宣：挑战高通骁龙8系

今天上午，联发科宣布新一代天玑芯片即将震撼登场，新品会在12月23日15点正式发布。据悉，这场发布会联发科将推出全新的天玑8400处理器，这颗芯片基于台积电4nm制程打造，采用Arm Cortex A

还有38%的上涨空间！亚马逊AI战略大爆发

“ AWS 的收入增长应该会继续加速。 ”作者 | RichardSaintvilus编译 | 华尔街大事件亚马逊公司( NASDAQ：AMZN ) 在当前水平上还有 38% 的上涨空间。这主要得益

【倒计时3天】2024RT-Thread开发者大会，本周六见！

亲爱的企业用户和开发者朋友们距离2024 RT-Thread开发者大会正式开幕仅剩最后3天！还没报名的小伙伴，抓紧报名噢，12月21日不见不散！大会时间与地点时间：2024年12月21日 9:30-1

文章评论

最新
热门

换一换

EE直播

更多>

IBM的AI芯片能否重塑深度学习推理？

耗电的人工智能

下一步

杂志声明