中科院微电子所刘明院士团队采用跨层次协同设计的方法,提出了高并行与高效能比的新型RRAM存内计算结构。 在器件层面,研究团队提出了带权重二晶体管一忆阻器(WH-2T1R)的存算阵列结构。

物联网与人工智能技术的迅猛发展对边缘节点计算平台的实时数据处理能力与能效提出了更高要求。基于新型存储器的非易失存内计算技术可实现数据的原位存储与计算、将数据搬运带来的功耗与延迟开销最小化,从而大幅提升边缘设备的数据处理能力与效能比。但由于基础单元特性的非理想因素,阵列中的寄生效应以及模数转换电路的硬件开销,非易失存内计算仍面临计算性能与能效方面的限制。 

  围绕上述关键问题,中科院微电子所刘明院士团队采用跨层次协同设计的方法,提出了高并行与高效能比的新型RRAM存内计算结构。 

  在器件层面,研究团队提出了带权重二晶体管一忆阻器(WH-2T1R)的存算阵列结构。WH-2T1R结构使用core晶体管构成解耦的存算数据通路来减小寄生效应对计算电流的影响,相较1T1R结构只额外造成30.3%的面积开销。计算单元利用第二晶体管亚阈值区放大特性提高计算13.5倍开关比的同时降低88%的低阻态计算电流,从而实现了63.4%的乘加操作功耗降低。得益于计算开关比的提升,该RRAM存内计算结构可支持更高的输入并行度和多比特乘加操作。 

  在电路层面,研究团队提出了参考电流减式电流型灵敏放大器的读出电路。由参考电流减支路根据上一次读出结果先对输入电流进行电流减再送到电流镜读出数据。参考电流减支路对半减小了电流镜输入电流范围,使RRAM存算结构支持的计算电流范围倍增,能实现更高输入并行和多比特乘加,并取得79.5%的读出电路功耗降低。研究团队通过进一步优化电流型灵敏放大器电流减配置,实现积分非线性误差5倍提升,微分非线性误差3.75倍提升。 

  在算法映射层面,研究团队提出了高位数据冗余(MSB_RSM)的映射策略。RRAM存内计算结构配备有不同第二晶体管multiplier参数的多组阵列和额外的一组冗余阵列。其中不同第二晶体管用于映射多比特权值的不同比特位。由于RRAM和晶体管非理想因素对计算电流的影响不容忽视,冗余阵列用于额外映射权值对非理想因素补偿。经过对不同比特位补偿效果的分析,MSB-RSM对高位权值进行操作时能减小1σ误差40%。得益于更稳定的计算电流,在ResNet-18模型下的CIFAR-10和CIFAR-100任务获得了0.96%和2.83%的准确度提升。 

  上述方案在团队自主开发的嵌入式28nm 工艺上得到验证,新型RRAM存内计算结构支持高并行的模拟域乘加操作,在1比特输入、3比特权值、4比特输出下ResNet-18任务中的平均能效达到30.34TOPS/W,并可以通过进一步优化读出时序提升到154.04TOPS/W。该工作通过单元、电路及系统面的系统设计,为高能效、高精度的模拟存内计算提供了新思路。 

  研究成果以“A 28nm RRAM Computing-in-Memory Macro Using Weighted Hybrid 2T1R Cell Array and Reference Subtracting Sense Amplifier for AI Edge Inference”为题发表在集成电路设计领域旗舰期刊IEEE Journal of Solid-State Circuits上,微电子所博士研究生叶望为该文章的第一作者、窦春萌研究员为该文章的通讯作者。

 

(a)基于RRAM的存内计算芯片结构框图,(b)芯片晶圆照片及版图,

(c)芯片测试数字波形,(d)芯片参数

责编:Luffy
阅读全文,请先
您可能感兴趣
PS1012采用了最新的第五代PCIe,与基于第四代的产品相比其带宽增大了一倍。因此,数据传输速度可达32GT/s(千兆传输/秒),顺序读取性能是以前一代规格产品的两倍,可达13GB/s(千兆字节/秒)。
SK海力士在HBM4上将对基础裸片的称呼已经从DRAM Base Die调整为Logic Base Die,强调了基础裸片愈发重要的逻辑功能。这意味着HBM4时代的基础裸片将全面转向逻辑半导体工艺。
有家存储芯片厂,今年全年的营收都在涨;持续特定存储领域No.1,究竟是怎么做到的?
继2022年和2023年行业低迷之后,市场曾普遍预期2024年将是行业反弹的起点。然而,进入2024年下半年,国内存储产业的复苏步伐意外放缓。
HBM4将用于特斯拉正在开发的AI数据中心及其自动驾驶汽车。其中,特斯拉采购HBM4芯片将用于强化其超级电脑Dojo的性能。
Rambus HBM4的控制器IP提供了32个独立通道的接口,总数据宽度可达2048位。基于这一数据宽度,当数据速率为6.4Gbps时,HBM4的总内存吞吐量将比HBM3高出两倍以上,达到1.64TB/s。与Rambus HBM3E控制器一样,HBM4内存控制器IP也是一个模块化、高度可配置的解决方案。
目前,智能终端NFC功能的使用频率越来越高,面对新场景新需求,ITMA多家成员单位一起联合推动iTAP(智能无感接近式协议)标准化项目,预计25年上半年发布1.0标准,通过功能测试、兼容性测试,确保新技术产业应用。
中科院微电子所集成电路制造技术重点实验室刘明院士团队提出了一种基于记忆交叉阵列的符号知识表示解决方案,首次实验演示并验证了忆阻神经-模糊硬件系统在无监督、有监督和迁移学习任务中的应用……
C&K Switches EITS系列直角照明轻触开关提供表面贴装 PIP 端子和标准通孔配置,为电信、数据中心和专业音频/视频设备等广泛应用提供创新的多功能解决方案。
投身国产浪潮向上而行,英韧科技再获“中国芯”认可
点击蓝字 关注我们安森美(onsemi)在2024年先后推出两款超强功率半导体模块新贵,IGBT模块系列——SPM31 IPM,QDual 3。值得注意的是,背后都提到采用了最新的FS7技术,主要性能
近期,多个储能电站项目上新。■ 乐山电力:募资2亿建200MWh储能电站12月17日晚,乐山电力(600644.SH)公告,以简易程序向特定对象发行A股股票申请已获上交所受理,募集资金总额为2亿元。发
来源:观察者网12月18日消息,自12月2日美国发布新一轮对华芯片出口禁令以来,不断有知情人士向外媒透露拜登政府在卸任前将采取的下一步动作。美国《纽约时报》12月16日报道称,根据知情人士以及该报查阅
投资界传奇人物沃伦·巴菲特,一位94岁的亿万富翁,最近公开了他的遗嘱。其中透露了一个惊人的决定:他计划将自己99.5%的巨额财富捐赠给慈善机构,而只将0.5%留给自己的子女。这引起了大众对于巴菲特家庭
 “ 担忧似乎为时过早。 ”作者 | RichardSaintvilus编译 | 华尔街大事件由于担心自动驾驶汽车可能取消中介服务,Uber ( NYSE: UBER ) 的股价在短短几周内从 202
在上海嘉定叶城路1688号的极越办公楼里,最显眼的位置上,写着一句话:“中国智能汽车史上,必将拥有每个极越人的名字。”本以为这句话是公司的企业愿景,未曾想这原来是命运的嘲弄。毕竟,极越用一种极其荒唐的
 “ AWS 的收入增长应该会继续加速。 ”作者 | RichardSaintvilus编译 | 华尔街大事件亚马逊公司( NASDAQ:AMZN ) 在当前水平上还有 38% 的上涨空间。这主要得益
点击蓝字 关注我们电网和可再生能源系统向着更智能、更高效的方向发展助力优化能源分配构建更加绿色和可靠的能源未来12 月 24 日 上午 9:30 - 11:302024 德州仪器新能源基础设施技术直播
极越汽车闪崩,留下一地鸡毛,苦的是供应商和车主。很多人都在关心,下一个倒下的新能源汽车品牌,会是谁?我们都没有未卜先知的超能力,但可以借助数据管中窥豹。近日,有媒体统计了15家造车新势力的销量、盈亏情
亲爱的企业用户和开发者朋友们距离2024 RT-Thread开发者大会正式开幕仅剩最后3天!还没报名的小伙伴,抓紧报名噢,12月21日不见不散!大会时间与地点时间:2024年12月21日 9:30-1