在最新一期的《Nature Electronics》期刊,IBM研究人员描述了一种名为Hermes的推理芯片设计与运作…

在最新一期的《Nature Electronics》期刊,IBM研究人员描述了一种名为Hermes的推理芯片设计与运作;该款在去年首度被打造出来的芯片,内含400万权重,以及64个核心,整合了模拟相变化内存,在读取深度神经网络时能提高速度与省电效益,让IBM得以验证该公司已经在设计的、朝向开发更能自给自足的端对端芯片之想法。

根据位于瑞士苏黎世地区IBM吕施利孔研究中心(Rüschlikon Center)、由研究员Abu Sebastian领军的研究团队说法,“该芯片实现了16.1~63.1TOPS (每秒兆次计算)的矩阵向量乘法(matrix-vector- multiplication)处理量峰值,能源效率为2.48~9.76TOPS W-1。”

该团队成员将他们的芯片与其他几款在过去几年发表的芯片性能基准测试结果进行比较,包括来自台积电/台湾清华大学(TSMC/NTHU)、AI芯片设计企业Mythic、美国普林斯顿大学(Princeton)的设计,以及神经形态芯片NeuRRAM;“尽管该芯片的能源效益通常较低,但相较于所有以电阻式内存为基础的模拟式存内计算(analog in-memory computing,AiMC)芯片,以1.8倍的更高处理量密度表现胜过了效率降低的问题。”

IBM研究团队指出,Hermes在CIFAR-10图像资料库的处理性能上胜过其他任何一款芯片。

存内计算

由于乘法计算扩展的方式(参考图1),深度学习模型的耗电量庞大,输入层的每一个节点在添加至其他节点、馈入下一层之前,必须乘以恰当的权重。因此,如果在第一层(Layer 1)有100个神经元,每一个都连结第二层(Layer 2)的100个神经元,就有1万个权重被储存,每个时间步长(time step)都有1万次乘法计算。

图1:来自某一层的输入乘以个别连结权重,然后下一层的神经元能加总输入(Σ)并执行响应函数(f);在一个每层有m个神经元、完全连结的n层网络中,每次推理的权重,以及权重乘法数量,大概是以平方纳米(nm²)大小来衡量。确切需要多少资源,取决于所需精度的高低;速度有多快,则部分取决于得移动多少权重以执行那些计算。这些都是在资料触及个别神经元取得响应之前。

存内计算(compute-in-memory)是一种模拟电子技术,看来很适合这类应用。首先,模拟架构减少了所需内存组件(device)数量,因为每一个内存组件都能代表多个位──在Hermes芯片,四组件内存能储存8位权重,甚至可能更多。

Hermes芯片实体照。

(来源:IBM Research)

其次,存内计算组件不是用逻辑来执行乘法计算,而是在内存电路本身的内部以电子方式进行:权重在纵横闩阵列(参考图2的黄色部分)被储存为电阻,来自第一层的信号作为电压输入到纵横闩的纵列(column)中(来自输入调变器,图2的橘色部分)。这些输入自然地被乘以权重,沿着交错的横列(row)传送;在其中它们会结合,并由模拟数字转换器(ADC)转换。

相变化的优势与挑战

除此之外,相变化材料──利用局部加热能将非晶体(高电阻)改变为晶体(低电阻)模式──特别适合此类应用。在推理芯片中,权重不应该需要太多改变,因此不需要能量来维持的内存,又一次改善了功耗。

然而,这类材料也有缺点──最重要的是组件不匹配(device mismatch),这导致它们的行为略有偏差。在类似的芯片中,这可以透过将网络载入芯片之后进行重新训练来克服。为避免这种制造后的调整,Hermes芯片采用了一种罕见的ADC配置。

首先,每一个横列都有其转换器(参考图2),这意味着整个阵列向量乘法能平行进行,降低延迟并提高处理量。其次,ADC被用来校准系统,有效消除了一些不匹配;在本地数字处理单元中的其他电路负责了大部份剩余的工作。

研究人员纳入Hermes芯片的另一个组件,是对角选择解码器(diagonal selection decoder,在图2顶部),这能精确隔离他们想要写入的组件,因此改善编程流程。

图2:网络权重在相变化材料纵横闩阵列中,透过编程组件(图顶部的灰色块)进行编程,并取得来自对角选择解码器(diagonal selection decoder,图底部红色块)的协助。一旦完成编程,调变器会从底部透过纵列送出资料,将其乘以权重然后沿着横列相加。ADC以及本地数字处理单元负责转换、校准并对信号做出响应。

(来源:由IBM研究中心发表于《Nature Electronics》的论文图1改绘)

在Hermes芯片上部署网络的研究人员Athanasios Vasilopoulos表示,团队的愿景是扩增通讯网络并将更多种类的数字单元纳入(因此举例来说,它们可以支持Transformer模型)。研究人员还打算将这些部署于能自己执行整个网络模型的更大芯片中,并且与其他芯片搭配运作。

“这同样不会是量产芯片,”Vasilopoulos表示:“那仍将是研究用设备,但可能为这类技术朝向成熟发展开辟一条道路,使其能成为真正的替代方案,但目前它还不是。”

Hermes研究芯片不会提供给IBM社群以外的人使用,但对它有兴趣的人可以透过使用IBM的神经网络训练与推理应用模拟存内硬件加速器(Analog In-Memory Hardware Acceleration Kit for Neural Network Training and Inference),以执行软件模拟的方式来测试该芯片在他们的应用中如何表现。

(参考原文:IBM Research Inference Chip Performance Results Released,by Sunny Bains)

本文同步刊登于台湾版《电子工程专辑》杂志20239月刊

责编:Amy.wu
阅读全文,请先
您可能感兴趣
新公司将包括本田、日产和三菱汽车,预计年销量将超过800万辆,成为世界第3大汽车制造集团。这将使新公司在全球汽车市场中占据重要地位,尤其是在与特斯拉和中国电动车品牌的竞争中。
新款开发板售价仅为249美元,而上一代40 TOPS开发板售价为499美元,价格仅为上一代的一半。这使得Jetson Orin Nano Super成为“世界上最经济实惠的生成式AI计算机”,特别适合商业AI开发者、爱好者和学生使用。
面对AI时代带来的差异化趋势、软件应用及开发时间长、软硬件协同难、高复杂度高成本等挑战,国产EDA仍需不断探索和创新。
印度政府希望通过这一系列的方式,“推动”中国品牌更深入地“融入”印度市场,并“加强”与当地的经济合作,比如鼓励中国企业与本土电子制造商建立合作关系,共同在印度生产智能手机。而vivo印度公司此次与迪克森成立合资公司,就是在以上政府指引下无奈作出的选择。
通过机器学习技术,EDA工具可以获取更精确的模型来预测设计中存在的问题,如布线拥塞、信号干扰、热效应等,从而为用户提供更准确快速的指导,避免后期返工。
此次柔宇显示名下资产的拍卖页面自11月28日就已经上线,直至12月15日拍卖结束,在这长达半个多月的时间里,始终没有任何人报名参与竞拍。
目前,智能终端NFC功能的使用频率越来越高,面对新场景新需求,ITMA多家成员单位一起联合推动iTAP(智能无感接近式协议)标准化项目,预计25年上半年发布1.0标准,通过功能测试、兼容性测试,确保新技术产业应用。
中科院微电子所集成电路制造技术重点实验室刘明院士团队提出了一种基于记忆交叉阵列的符号知识表示解决方案,首次实验演示并验证了忆阻神经-模糊硬件系统在无监督、有监督和迁移学习任务中的应用……
C&K Switches EITS系列直角照明轻触开关提供表面贴装 PIP 端子和标准通孔配置,为电信、数据中心和专业音频/视频设备等广泛应用提供创新的多功能解决方案。
投身国产浪潮向上而行,英韧科技再获“中国芯”认可
来源:苏州工业园区12月17日,江苏路芯半导体技术有限公司掩膜版生产项目迎来重要进展——首批工艺设备机台成功搬入。路芯半导体自2023年成立以来,专注于半导体掩膜版的研发与生产,掌握130nm至28n
万物互联的时代浪潮中,以OLED为代表的新型显示技术,已成为人机交互、智能联结的重要端口。维信诺作为中国OLED赛道的先行者和引领者,凭借自主创新,实现了我国OLED技术的自立自强,成为中国新型显示产
对于华为来说,今年的重磅机型都已经发完了,而明年的机型已经在研发中,Pura 80就是期待很高的一款。有博主爆料称,华为Pura 80将会用上了豪威OV50K传感器,同时电池容量达到5600毫安时。至
万物互联的时代浪潮中,以OLED为代表的新型显示技术,已成为人机交互、智能联结的重要端口。维信诺作为中国OLED赛道的先行者和引领者,凭借自主创新,实现了我国OLED技术的自立自强,成为中国新型显示产
 “ 担忧似乎为时过早。 ”作者 | RichardSaintvilus编译 | 华尔街大事件由于担心自动驾驶汽车可能取消中介服务,Uber ( NYSE: UBER ) 的股价在短短几周内从 202
近期,高科视像、新视通、江苏善行智能科技等企业持续扩充COB产能。插播:加入LED显示行业群,请加VX:hangjia188■ 高科视像:MLED新型显示面板生产项目(二期)招标12月18日,山西高科
又一地,新型储能机会来了?■ 印度:2032储能增长12倍,超60GW据印度国家银行SBI报告,印度准备大幅提升能源存储容量,预计到2032财年将增长12 倍,超60GW左右。这也将超过可再生能源本身
在上海嘉定叶城路1688号的极越办公楼里,最显眼的位置上,写着一句话:“中国智能汽车史上,必将拥有每个极越人的名字。”本以为这句话是公司的企业愿景,未曾想这原来是命运的嘲弄。毕竟,极越用一种极其荒唐的
点击蓝字 关注我们电网和可再生能源系统向着更智能、更高效的方向发展助力优化能源分配构建更加绿色和可靠的能源未来12 月 24 日 上午 9:30 - 11:302024 德州仪器新能源基础设施技术直播
极越汽车闪崩,留下一地鸡毛,苦的是供应商和车主。很多人都在关心,下一个倒下的新能源汽车品牌,会是谁?我们都没有未卜先知的超能力,但可以借助数据管中窥豹。近日,有媒体统计了15家造车新势力的销量、盈亏情