该模型采用前馈全连接神经网络架构,其中隐藏层权重分别由二值权重和浮点型权重两部分组成(图1a)。模型在进行多任务连续学习时采用了非对称权重更新策略,通过限制与新任务相关性弱的权重更新,平衡权重的可塑性与稳定性,从而有效缓解灾难性遗忘(图1b)。在硬件方面……

近年来,以深度学习和神经网络为代表的人工智能技术在人脸识别、自动驾驶、智慧城市和健康监测等多个领域迅速发展。但传统神经网络模型在处理多任务连续学习时将会面临灾难性遗忘问题,即神经网络在学习新任务时会遗忘已经学到的知识,导致在执行先前任务时性能大幅下降。 

针对这一问题,微电子所微电子器件与集成技术重点实验室刘明院士团队的尚大山研究员、香港大学的王中锐博士和清华大学刘勇攀教授等基于忆阻器存算一体芯片,开发了一款软—硬件协同设计的连续学习原型系统。在软件方面,受人类大脑启发,团队提出了一种基于突触元可塑性的混合精度连续学习模型(MPCL)。该模型采用前馈全连接神经网络架构,其中隐藏层权重分别由二值权重和浮点型权重两部分组成(图1a)。模型在进行多任务连续学习时采用了非对称权重更新策略,通过限制与新任务相关性弱的权重更新,平衡权重的可塑性与稳定性,从而有效缓解灾难性遗忘(图1b)。在硬件方面,团队将MPCL模型部署在一个由忆阻器(RRAM)存算一体(IMC)芯片和通用数字处理器组成的混合模拟数字硬件系统上(图1c)。通过将二进制权重映射到忆阻器阵列,该系统采用IMC计算范式,利用基尔霍夫定律和欧姆定律加速向量矩阵乘法操作,减少了处理器和存储器之间数据传输的能量和时间开销。同时,为减轻忆阻器非理想因素对系统性能的影响,团队在软件模拟中重构了与硬件完全相同的计算流程,并利用原位精调的方法优化了权重的映射过程,并使硬件系统在保持推理准确率的同时最大限度地提高计算并行度(图1d)。该原型系统在MNIST和Fashion MNIST数据集上分别实现五个任务连续学习94.9%和95.3%的平均准确率(图1e),同时相较于传统数字系统,核心运算能耗得到大幅降低(图1f)。这种基于忆阻器存算一体能力的连续学习实现方案,为未来构建具有自适应能力的低能耗人工智能体提供了参考。 

该项目得到了科技部、国家自然科学基金委、中科院和香港大学的支持。成果近期发表在《先进智能系统》期刊上(Advanced Intelligent Systems, DOI: 10.1002/aisy.202200026),微电子所博士研究生李熠为文章的第一作者,香港大学王中锐博士,微电子所尚大山研究员为该文章的共同通讯作者。Wiley学术出版集团科技新闻网站Advanced Science News对这一研究结果以“Continual learning, just like humans”为题进行了专题报道。 

 

图1. (a) 混合精度连续学习模型程序框图;(b)非对称更新策略限制权重更新;(c)基于忆阻器芯片的数模混合硬件系统;(d)并行度优化前后准确率对比;(e)多任务连续学习的硬件准确率与软件基准对比;(f)与数字系统MAC功耗对比。

文章链接:https://doi.org/10.1002/aisy.202200026 

Mixed-precision continual learning based on computational resistance random access memory

Yi Li, Woyu Zhang, Xiaoxin Xu, Yifan He, Danian Dong, Nanjia Jiang, Fei Wang, Zeyu Guo, Shaocong Wang, Chunmeng Dou, Yongpan Liu, Zhongrui Wang,* Dashan Shang*

Advanced Intelligent Systems (2022). 

DOI: 10.1002/aisy.202200026

责编:Luffy
阅读全文,请先
您可能感兴趣
尽管市场上有传言称英伟达大幅削减了对台积电CoWoS-S封装的需求,甚至有报告指出砍单幅度高达80%,但台积电和英伟达均对此进行了否认......
很多人以为,今年CES上老黄演讲的主角是GeForce显卡,但其实是他手里握有的机器人相关的“时间宝石”...
OpenAI认为,芯片、数据、能源和人才是赢得人工智能的关键,且建议美国政府大幅增加对这些领域的投资。
索尼新专利利用人工智能(AI)技术来预测玩家的操作输入,从而显著减少在线游戏中常见的延迟问题。这项创新技术被称为“定时输入/动作释放”,通过智能AI模型提前判断玩家的意图,并在实际操作完成之前执行相应的指令,从而提升游戏的流畅度和响应速度......
目前,这些故障主要影响了首批搭载Blackwell芯片的机架,从而引发了客户的担忧。其中,微软、亚马逊网络服务公司(AWS)、谷歌和Meta这四大主要客户已经削减了对Blackwell GB200机架的订单。
最近华硕在景德镇召开了一场新品发布会,而这次发布的AI PC大概能代表2025一整年的AI PC走向...
大多数研发人员和导热界面材料配方设计师可能会推荐使用具备诸多优异特性的硅。然而,也存在一些例外情况。这些问题强调了在选择导热界面材料时考虑终端产品最终应用的重要性.....
在与芯科科技(Silicon Labs)首席技术官Daniel Cooley的交谈中,我们了解到该公司在物联网(IoT)和智能边缘领域所发挥的作用和未来发展。
虽然绕过产品防伪保护的手段变得越来越高级,但是最新的 NFC 芯片技术提高了信息安全性,让品牌能够保护知识产权,预防客户误买假冒商品。
西门子推出Simcenter更新版本,助力客户简化工作流程,加快航空航天认证,同时提供深入洞见
近日,荣耀公司高层人事变动频繁,继原CEO赵明因身体原因离职后,荣耀中国区CMO姜海荣、中国区销售部部长郑树宝等多位高管也相继离职。           1月20日,据荣耀内部公告,荣耀中国区CMO姜
该计划旨在降低成本,减少网络风险和运营的复杂性首批合作伙伴包括 Forescout、Instrumentix 和 Nozomi Networks是德科技(NYSE:KEYS)推出网络可视化合作伙伴计划
“什么是5G,用户说了算”。记得在5G商用之前,当人们都在谈论5G是什么、5G到底能做啥时,这句话引起了业界广泛共鸣——5G建设和发展需倾听用户的声音,以消费者和各行各业日益增长的需求为导向。时至今日
● 第六届半导体湿电化学品与电子气体论坛将于3月19日在杭州召开1月20日消息,据外媒报道,英特尔已成为“某家公司”的收购目标,而特斯拉CEO马斯克被认为是该传闻中英特尔的潜在收购者!据悉,这一收购传
亚化咨询重磅推出《中国半导体材料、晶圆厂、封测项目及设备中标、进口数据全家桶》。本数据库月度更新,以EXCEL表格的形式每月发送到客户指定邮箱。中国大陆半导体大硅片项目表(月度更新)中国大陆再生晶圆项
    三极管的电流放大作用应该算是模拟电路里面的一个难点内容,我想用这几个动画简单的解释下为什么小电流Ib能控制大电流Ic的大小,以及放大电路的原理。    我这里的三极管也叫双极型晶体管,模电的放
目前,联想已经在印度工厂生产笔记本电脑和台式电脑,后续还将生产 AI 服务器,而摩托罗拉智能手机、平板电脑和笔记本电脑也在由代工商 Dixon Technologies 进行生产。联想印度公司总经理
‌‌Jan. 21, 2025 产业洞察根据TrendForce集邦咨询调查1月21日嘉义地区芮氏规模6.4地震对邻近的晶圆代工厂、面板厂影响情况,TSMC(台积电)及UMC(联电)的台南厂因震度达4
根据中国台湾气象署所发布的报告显示,中国台湾南部地区于1月21日上午零点17分27秒发生里氏地震规模6.4的地震,震中位于北纬23.23度,东经120.57度,即在嘉义县政府东南方37.9公里,位于嘉
近日,纳芯微宣布推出全新基于AMR(各向异性磁阻技术)的轮速传感器NSM41xx系列。该系列产品通过集成先进的磁性传感敏感单元与ASIC技术,能够精准监测车轮转速,为防抱死制动系统(ABS)、车身电子