在最新一期的《Nature Electronics》期刊,IBM研究人员描述了一种名为Hermes的推理芯片设计与运作…

在最新一期的《Nature Electronics》期刊,IBM研究人员描述了一种名为Hermes的推理芯片设计与运作;该款在去年首度被打造出来的芯片,内含400万权重,以及64个核心,整合了模拟相变化内存,在读取深度神经网络时能提高速度与省电效益,让IBM得以验证该公司已经在设计的、朝向开发更能自给自足的端对端芯片之想法。

根据位于瑞士苏黎世地区IBM吕施利孔研究中心(Rüschlikon Center)、由研究员Abu Sebastian领军的研究团队说法,“该芯片实现了16.1~63.1TOPS (每秒兆次计算)的矩阵向量乘法(matrix-vector- multiplication)处理量峰值,能源效率为2.48~9.76TOPS W-1。”

该团队成员将他们的芯片与其他几款在过去几年发表的芯片性能基准测试结果进行比较,包括来自台积电/台湾清华大学(TSMC/NTHU)、AI芯片设计企业Mythic、美国普林斯顿大学(Princeton)的设计,以及神经形态芯片NeuRRAM;“尽管该芯片的能源效益通常较低,但相较于所有以电阻式内存为基础的模拟式存内计算(analog in-memory computing,AiMC)芯片,以1.8倍的更高处理量密度表现胜过了效率降低的问题。”

IBM研究团队指出,Hermes在CIFAR-10图像资料库的处理性能上胜过其他任何一款芯片。

存内计算

由于乘法计算扩展的方式(参考图1),深度学习模型的耗电量庞大,输入层的每一个节点在添加至其他节点、馈入下一层之前,必须乘以恰当的权重。因此,如果在第一层(Layer 1)有100个神经元,每一个都连结第二层(Layer 2)的100个神经元,就有1万个权重被储存,每个时间步长(time step)都有1万次乘法计算。

图1:来自某一层的输入乘以个别连结权重,然后下一层的神经元能加总输入(Σ)并执行响应函数(f);在一个每层有m个神经元、完全连结的n层网络中,每次推理的权重,以及权重乘法数量,大概是以平方纳米(nm²)大小来衡量。确切需要多少资源,取决于所需精度的高低;速度有多快,则部分取决于得移动多少权重以执行那些计算。这些都是在资料触及个别神经元取得响应之前。

存内计算(compute-in-memory)是一种模拟电子技术,看来很适合这类应用。首先,模拟架构减少了所需内存组件(device)数量,因为每一个内存组件都能代表多个位──在Hermes芯片,四组件内存能储存8位权重,甚至可能更多。

Hermes芯片实体照。

(来源:IBM Research)

其次,存内计算组件不是用逻辑来执行乘法计算,而是在内存电路本身的内部以电子方式进行:权重在纵横闩阵列(参考图2的黄色部分)被储存为电阻,来自第一层的信号作为电压输入到纵横闩的纵列(column)中(来自输入调变器,图2的橘色部分)。这些输入自然地被乘以权重,沿着交错的横列(row)传送;在其中它们会结合,并由模拟数字转换器(ADC)转换。

相变化的优势与挑战

除此之外,相变化材料──利用局部加热能将非晶体(高电阻)改变为晶体(低电阻)模式──特别适合此类应用。在推理芯片中,权重不应该需要太多改变,因此不需要能量来维持的内存,又一次改善了功耗。

然而,这类材料也有缺点──最重要的是组件不匹配(device mismatch),这导致它们的行为略有偏差。在类似的芯片中,这可以透过将网络载入芯片之后进行重新训练来克服。为避免这种制造后的调整,Hermes芯片采用了一种罕见的ADC配置。

首先,每一个横列都有其转换器(参考图2),这意味着整个阵列向量乘法能平行进行,降低延迟并提高处理量。其次,ADC被用来校准系统,有效消除了一些不匹配;在本地数字处理单元中的其他电路负责了大部份剩余的工作。

研究人员纳入Hermes芯片的另一个组件,是对角选择解码器(diagonal selection decoder,在图2顶部),这能精确隔离他们想要写入的组件,因此改善编程流程。

图2:网络权重在相变化材料纵横闩阵列中,透过编程组件(图顶部的灰色块)进行编程,并取得来自对角选择解码器(diagonal selection decoder,图底部红色块)的协助。一旦完成编程,调变器会从底部透过纵列送出资料,将其乘以权重然后沿着横列相加。ADC以及本地数字处理单元负责转换、校准并对信号做出响应。

(来源:由IBM研究中心发表于《Nature Electronics》的论文图1改绘)

在Hermes芯片上部署网络的研究人员Athanasios Vasilopoulos表示,团队的愿景是扩增通讯网络并将更多种类的数字单元纳入(因此举例来说,它们可以支持Transformer模型)。研究人员还打算将这些部署于能自己执行整个网络模型的更大芯片中,并且与其他芯片搭配运作。

“这同样不会是量产芯片,”Vasilopoulos表示:“那仍将是研究用设备,但可能为这类技术朝向成熟发展开辟一条道路,使其能成为真正的替代方案,但目前它还不是。”

Hermes研究芯片不会提供给IBM社群以外的人使用,但对它有兴趣的人可以透过使用IBM的神经网络训练与推理应用模拟存内硬件加速器(Analog In-Memory Hardware Acceleration Kit for Neural Network Training and Inference),以执行软件模拟的方式来测试该芯片在他们的应用中如何表现。

(参考原文:IBM Research Inference Chip Performance Results Released,by Sunny Bains)

本文同步刊登于台湾版《电子工程专辑》杂志20239月刊

责编:Amy.wu
阅读全文,请先
您可能感兴趣
尽管思瑞浦在模拟混合信号设计方面拥有丰富经验,其MCU产品在市场上的表现并不理想。究其原因,是因为国内MCU领域竞争已经非常激烈,产品同质化严重,企业之间的竞争主要集中在性价比上,导致利润空间被严重压缩。
随着工艺技术的发展放缓而晶体管数量增加,芯片开发变得越来越困难。Synopsys选择了收购设计分析和仿真巨头Ansys,此后,拥有管理和优化 EDA 计算环境所需所有工具的Altair,成为了最后一个可以挑战 Ansys 而不受约束的玩家。如今,花落西门子……
A某现年50多岁,居住在安徽省合肥市,被逮捕前在一家中国芯片公司工作,与妻子和两个女儿共同生活。去年12月,合肥市国家安全局的调查人员将A某从家中带走,并在当地酒店隔离调查了5个多月……
10月30日,中兴通讯对此事进行了官方回应,表示对联想在英国高等法院提起知识产权诉讼感到十分遗憾。
小米SU7 Ultra以6分46秒874的成绩刷新了纽北尘封7年的最速四门车圈速纪录,代表中国品牌首次拿下“纽北全球最速四门车”的桂冠,也让中国车第一次站在了世界之巅。
英特尔在2024年上半年面临较大的财务压力,尽管部分业务如客户端计算业务表现良好,但整体收入增长放缓且出现亏损。为此,今年 8 月,英特尔采取了包括裁员在内的多项措施以改善财务状况,并计划到2025年节省100亿美元的成本。
微电子和软件技术的快速发展正在深刻地改变车载娱乐中控和安全系统设计,重新定义驾驶体验。
本系列文章从数字芯片设计项目技术总监的角度出发,介绍了如何将芯片的产品定义与设计和验证规划进行结合,详细讲述了在FPGA上使用硅知识产权(IP)内核来开发ASIC原型项目时,必须认真考虑的一些问题。
在即将到来的慕尼黑国际电子元器件博览会(electronica 2024)上,英飞凌科技股份公司将展示其创新的解决方案如何推动全球低碳化和数字化进程,充分展现半导体产品如何为实现净零经济铺平道路,并释放人工智能的全部潜力。
vivo旗下品牌iQOO正式发布了年度性能旗舰iQOO 13,除了高通骁龙8芯片、vivo自研的电竞芯片Q2外,最值得一提的是还采用了汇顶科技提供的多项创新技术,包括超声波指纹识别、新一代屏下光线传感器以及智能音频放大器与软件方案。
8月30日晚,欧菲光披露2024年第三季度报告。           数据显示,今年第三季度,欧菲光实现营收49.35亿元,同比增长9.56%;归属于上市公司股东的净利润为797.47万元,同比减少8
亚化咨询重磅推出《中国半导体材料、晶圆厂、封测项目及设备中标、进口数据全家桶》。本数据库月度更新,以EXCEL表格的形式每月发送到客户指定邮箱。中国大陆半导体大硅片项目表(月度更新)中国大陆再生晶圆项
本文来源:智能通信定位圈10月24日,全球领先的物联网(IoT)解决方案提供商Silicon Labs(下称“芯科科技“)在上海成功举办2024年“Works With开发者大会”。本届大会以“创新结
10月30日,备受瞩目的iQOO最新旗舰机——被誉为“性能之光”的iQOO 13在深圳震撼发布。该款机型由BOE(京东方)独供6.82英寸超旗舰2K LTPO直屏,行业首发搭载全新一代Q10发光器件,
GIPHY平台于2023年被Shutterstock收购,每天触达超过10亿用户。美通社消息,作为全球最大的GIF和贴纸库,GIPHY与领先的移动短视频平台TikTok达成合作,旨在通过人工智能技术驱
10月30日,北京汽车宣布与埃及国际汽车(Egyptian International Motors)旗下子公司 Alkan Auto 汽车公司签署在埃及进行电动汽车组装生产的备忘录。据介绍,该工厂占
10月31消息,据报道,三星电子目前正逐步扩大高通骁龙芯片在其产品中的应用范围,尤其是在旗舰手机中,仅有少数低端市场和家电产品采用自家Exynos芯片。据行业内部消息透露,三星正积极探索将高通芯片技术
10月30日,据多家媒体报道,大运集团旗下高端新能源品牌远航汽车被自家员工曝出人员流失较为严重、延迟发放工资等情况。有自称是远航汽车研发部人士表示,底盘研发部门人员流失速度快,目前仅剩十余名员工坚守岗
10月29日,诺基亚与惠普宣布签署了一项多年专利授权协议,允许惠普公司在其设备中使用诺基亚的视频技术。诺基亚一年前曾表示,已在美国对惠普提起法律诉讼,指控惠普未经授权使用诺基亚专利的视频相关技术,但本
理想汽车最近宣布成立了一个专注于海外业务的一级部门,由王进领导,他将直接向销售与服务高级副总裁邹良军汇报工作。理想汽车表示,此次海外扩张计划重点关注中东和中亚市场,并考虑进入拉丁美洲市场。公司打算在这