2023年知存科技将会推出第三代存内计算架构产品——WTM-8和WTM-C series,最高可以支持100Tops左右的算力,同时也会推出10-30Tops不同档次算力的存内计算产品。

当前,硅基芯片已经接近物理材料极限,而以人工智能、大数据、超级计算机等对大算力提出越来越高的要求,使得单纯靠缩微化制程已经无法满足需求,而且成本急速攀升,亟需一种新的芯片技术来解决算力滞后的问题。

最近几年,存算一体芯片成为资本和市场热捧的火热赛道,被认为是破解芯片缩微化难题的主要解决技术路线之一。在2022国际集成电路展览会暨研讨会(IIC2022)全球CEO峰会上,知存科技创始人兼CEO王绍迪以“WTM存内计算芯片应用及发展”为主题,详细介绍了最新存内芯片WTM2101产品优势以及相关应用场景,同时对知存科技未来发展规划作了相关分享。

知存科技创始人兼CEO王绍迪

如何破解存储墙、能耗墙?

存算一体技术是什么?王绍迪介绍,存算一体技术是最近几年非常火热的一个话题,尤其最近几年相关技术性突破已经吸引了越来越多的注意力及资源投入到相关的技术研发中。“一直以来,知存科技一直专注于存算一体技术的研发。基于数模混合存算一体的技术,也被认为是存算一体中最高效的一项技术,可以去突破存储墙、能耗墙,打破限制的一项技术。”

据悉,知存科技于2017年成立,一直致力于推动存算一体的产业化,但实际上公司核心团队在存算一体技术上已经技术耕耘与沉淀了十年的时间。公司核心团队在2012年设计出第一个芯片,2013年首席科学家就已经进行了存算一体芯片的投片,当时大部分人甚至还没有听过存算一体技术,也不知道存内计算是什么样的技术。在过去十年存内计算研发历程中,公司创始团队及公司做了很多0到1突破性的研发工作,包括2016年公司首席科学家发表了首个存内计算深度学习芯片。2019年11月,知存科技发布了国际首个存算一体芯片产品WTM1001。

王绍迪表示,“存内计算的计算原理和逻辑计算完全不一样。存内计算的计算原理可以理解成是用存储器做计算,其计算单元不再是逻辑器件、CPU、GPU或者NPU,与这些架构是完全不一样的。存内计算直接运算单元是存储单元本身。我们去做存内计算,就是要解决存储墙、能耗墙得问题。”

随着人工智能应用的快速发展,以及算法模型的种类参数规模的不断提升,对硬件算力需求也越来越高,导致摩尔定律的演进难以为继。在当前算力急剧增大的时间点,存储墙、能耗墙成为整个芯片计算的瓶颈。

“目前整个计算架构有CPU、GPU、内存、缓存及存储,离计算单元越近的单元,其存储单元速度越快,但是容量越小,离计算单元越远的单元,它的速度慢,但是容量越大。在AI计算时代,数据量是爆炸式增长,我们没法用离计算单元很近的缓存就把所有计算数据存储下来。因此,计算单元中必然会出现数据大量在存储器和计算单元之间搬运。”王绍迪介绍,未来,摩尔定律将走到尽头。从现有芯片架构来看,超过60%时间是花在数据搬运上,超过90%的功耗也损失在数据搬运上。因此,在现有的芯片架构中,大算力芯片最大的瓶颈是数据搬运或者存储墙的问题,并且短时间内看不到一个很好的解决方案。这也是为什么过去几年存内计算或者存算一体技术越来越被关注的原因。

他也介绍,“存内计算技术是利用存储器单元本身模拟或者物理性质完成计算,把原先存储器存储单元变成计算单元。存储器里面存储单元数量是非常多的,如果把每个存储单元都变成一个计算单元,包括它的计算并行度还有计算器件单元,会比现在的NPU、GPU量级高出两到三个的数量级。因此,存算一体技术具有巨大的发展潜力。”

另外,存算一体技术利用了存储器的结构,非常适合人工智能或者一些数据处理矩阵类的计算。因为这些矩阵类计算在传统架构当中对存储器读取次数可能要几万次、几十万次。但在存算一体架构中,利用存储器一次读取操作,就可以完成整个矩阵的计算,相当于原先要做几万次存储器读写操作,在存算一体芯片中只需要一次。那么,存算一体技术就可以大幅度减小计算单元调用次数,减少存储器次数,提高运算的效率。

不过,王绍迪也指出,存算一体技术具有很多架构上的优势,但其技术挑战难点也很多。在存算一体芯片中,计算单元不再是逻辑计算单元,没法用现有芯片设计的工具或者芯片设计的方法去设计,必须采用新的一种基于模拟电路的设计,而且其中还有很多“技术无人区”需要探索。

WTM2101芯片的优势及相关应用

过去十年,知存科技核心团队不断迭代芯片技术接近20次,也进行了5年重点技术研发,使其始终处于行业领先地位。2021年2月,知存科技完成WTM2101芯片小批量试产投片,今年实现WTM2101芯片量产投产,其也是国际首个量产的存内计算SOC芯片。

那么,WTM2101芯片主要优点是什么?王绍迪作了一个对比:在比市场上算法算力大出10倍以上的算法放在存算一体芯片中运行,可以看到其可以完全满足计算需求,且只有现有最佳解决方案20%-40%的功耗。因此,相当于在功耗降低情况下又可以把算力提升10倍以上,整体能效提升可以达到50倍以上,并且芯片采用WLCSP的封装仅有非常小的体积。WTM2101芯片是一个适合于用在低功耗包括电子设备、可穿戴设备等应用的芯片,而且它的算力也是非常高。

王绍迪介绍,WTM2101芯片采用存内计算芯片架构,有1.8兆赫存内计算的单元,采用最常用的存储介质Flash。在SOC芯片里,Flash单元提供50Gops算力,不由任何计算单元提供,因而其算力非常大。同时,这个芯片里也采用一个Risc-V的CPU,大概是148MHz,但是它的算力也跟正常嵌入式CPU算力是相当的。这个芯片在运行AI计算中有非常强大的算力,有50Gops的算力。此外,该款芯片还提供常规算法运用所需要的,包括需要运行的RAM和常规通用的接口,但它的运行功耗很低,运行功耗1毫安以内就可以实现复杂的算法。

目前,该款芯片主要应用在智能语音、智能手表等应用,未来也将应用于更多的应场景中,比如语音指令、声音增强、健康检测、降噪处理、手势识别、视觉识别、低功耗/高精度定位计算等。

其中,这款芯片主要应用于语音增强,可以通过深度学习的算法把人声和噪声分离开,其具有足够高的算力,比一般市场上穿戴设备跑的算力高出4-8倍的级别,但是它的功耗却还降低了1倍。同时,这个芯片可以进行命令词的识别,最多可以做到300个词连续识别,识别率可以达到95%,误识别率在24小时一次以内,并且功耗非常低,且响应速度也非常好。

 在穿戴领域中,该芯片适合做健康监控,包括PPG、ECG、G-sensors的数据,通过融合的算法提取出来,得到更精准的心律、血压等数据,适合在运动情况下区分信号是来自于真正的心律的还是血氧的信号,还是来自运动的干扰。王绍迪表示,目前基于深度学习的健康检测算法,已经在高端运动设备中得到应用,但一般功耗都比较高,而这款芯片可以把这个功耗降到4-8倍的级别,是一个非常低功耗的运行算法。

目前来看,知存科技现有存内计算的产品,主要针对低功耗、小型化设备、穿戴设备、电子设备应用产品,主要应用场景限制在低功耗的场景。但王绍迪表示,目前数据处理、人工智能计算已经进行到二维、三维的计算,意味着需要进行立体的数据处理,这非常适合存算一体的芯片架构。

在接受电子工程专辑采访中,他也表示,存算一体技术最大的挑战就是来自生态的建立,“过去几年,存内计算技术发展非常快,但存算一体计算范式跟现在的算法不一样,其在存算一体中训练出来,且在数模混合结构中训练,最大的问题在于怎么把现在应用的算法更好地在这种新的计算方式中实现,因此需要一个生态的建立。”

对此,知存科技也作了相关的规划:一是针对存算一体开发如何训练算法,且更好适合存算一体的芯片;二是把存内计算的运算模式,即在存储器当中,基于存储器的物理性质,以存储单元进行计算,把这种物理的性质带到算法的训练过程当中,以在训练过程中了解到运算的特点,训练出来的算法更适合于存内计算;三是做一个预测性的工作,比如在芯片中到底跑出多快的速度、什么样的功耗、精确度,不同环境下可以做到什么水平,即以一个很准确的预测模型做到效果的提前预测,帮助用户开发存内计算产品。

第三代存内计算产品“呼之欲出”

经过过去几年的技术研发沉淀,包括知存科技在内的企业的存算一体技术发展非常快,也陆续推出了相应的产品。王绍迪预计,存内计算每年算力将会提高10倍以上,“毕竟现在存内计算发展还处于‘婴儿阶段’,现在采用的存储器容量都是在几兆级别。目前已经非常成熟的存储器已经达到TB级别,像存内计算兆B级别到TB级别,还有百万倍提升空间。未来随着存储器容量越来越大,算力也会越来越大。”

他还透露,2023年知存科技将会推出第三代存内计算架构产品——WTM-8和WTM-C series,最高可以支持100Tops左右的算力,同时也会推出10-30Tops不同档次算力的存内计算产品,精度也从现在的8比特上升到16比特精度,运算效率从现在10Tops/w 到 40Tops/w的运行效率,主要针对4K、8K更高分辨率的成象和显示处理。他表示,“目前第三代芯片已经完成验证,预计明年会完成量产。第三代存内计算架构是一个更持久的、适用于可拓展的架构,不再是每一代芯片每一年都换一个架构,未来几年可以持续用第三代存内计算架构解决算力的问题。”

在一些底层的工艺上,知存科技作为创新型的研发企业,不只做芯片的设计工作,从2021年开始就与代工厂深度合作,进行诸多工艺改良。据透露,预计2023年底知存科技将推出一个更适用于存内计算存储单元的结构,单个单元可以存储多4倍的数据。

同时,知存科技还在做异构多层的工艺,使单个存内计算阵列容量会做得更大。如同芯片在单位面积下集成的晶体管越多,计算性能就越强。而知存科技也在存内计算芯片中研发在单位面积下集成更多的计算单元,以大幅度提升运算效率、能效、成本。

另外,王绍迪也介绍,知存科技也在积极探索先进的集成封装工艺,包括chiplets。他认为,chiplets非常适合存内计算跟不同其他计算单元融合,因为存内计算主要单元介质是存储器。未来,随着chiplets的发展,存内计算芯片架构在集成CPU、GPU以及其他逻辑单元上会更加容易。

他也指出,现在先进的3D集成工艺,也可以让存储单元更好跟先进工艺集成。鉴于存储器工艺与逻辑工艺之间的代差,先进的3D集成工艺可以让存内计算跨过代差,更好利用先进工艺发挥其优势。目前知存科技已经完成很多研发、专利布局。

在接受电子工程专辑采访被问及“对于2023年苹果将推出MR头显设备”的看法时,王绍迪也表示很期待。他认为,未来元宇宙产品的交互方式值得关注,而存内计算芯片未来将发挥重要作用。

责编:Jimmy.zhang
本文为EET电子工程专辑原创文章,禁止转载。请尊重知识产权,违者本司保留追究责任的权利。
阅读全文,请先
您可能感兴趣
PS1012采用了最新的第五代PCIe,与基于第四代的产品相比其带宽增大了一倍。因此,数据传输速度可达32GT/s(千兆传输/秒),顺序读取性能是以前一代规格产品的两倍,可达13GB/s(千兆字节/秒)。
按照发行价计算、铠侠市值约7,840亿日元(约合51.8亿美元),将超越10月上市的东京地下铁(以IPO价计算的市值为7,000亿日元)、成为日本今年来最大规模的IPO案。
三星于11月开始将这项先进技术转移到平泽P1厂的量产线上。这一成绩意味着三星将处于NAND Flash闪存技术的领先地位,领先于主要竞争对手SK海力士量产的321层堆栈NAND Flash闪存。
尽管市场上有大量关于长江存储借壳万润科技的传闻和分析,但这些传闻并未得到官方确认。长江存储此次明确澄清了“从无任何借壳上市的意愿”,并特别点名了万润科技,称与其“无直接业务合作”。
韩国半导体行业的全球地位不容忽视,特别是在存储、DDIC(显示驱动芯片)等领域占据了绝对的优势,存储半导体的全球市场占有率更是高达50%以上。12月3日晚的“紧急戒严”和韩国政坛局势的急剧转变,会对其半导体产业产生什么影响?
SK海力士在HBM4上将对基础裸片的称呼已经从DRAM Base Die调整为Logic Base Die,强调了基础裸片愈发重要的逻辑功能。这意味着HBM4时代的基础裸片将全面转向逻辑半导体工艺。
目前,智能终端NFC功能的使用频率越来越高,面对新场景新需求,ITMA多家成员单位一起联合推动iTAP(智能无感接近式协议)标准化项目,预计25年上半年发布1.0标准,通过功能测试、兼容性测试,确保新技术产业应用。
中科院微电子所集成电路制造技术重点实验室刘明院士团队提出了一种基于记忆交叉阵列的符号知识表示解决方案,首次实验演示并验证了忆阻神经-模糊硬件系统在无监督、有监督和迁移学习任务中的应用……
C&K Switches EITS系列直角照明轻触开关提供表面贴装 PIP 端子和标准通孔配置,为电信、数据中心和专业音频/视频设备等广泛应用提供创新的多功能解决方案。
投身国产浪潮向上而行,英韧科技再获“中国芯”认可
来源:苏州工业园区12月17日,江苏路芯半导体技术有限公司掩膜版生产项目迎来重要进展——首批工艺设备机台成功搬入。路芯半导体自2023年成立以来,专注于半导体掩膜版的研发与生产,掌握130nm至28n
投资界传奇人物沃伦·巴菲特,一位94岁的亿万富翁,最近公开了他的遗嘱。其中透露了一个惊人的决定:他计划将自己99.5%的巨额财富捐赠给慈善机构,而只将0.5%留给自己的子女。这引起了大众对于巴菲特家庭
‍‍12月18日,深圳雷曼光电科技股份有限公司(下称“雷曼光电”)与成都辰显光电有限公司(下称“辰显光电”)在成都正式签署战略合作协议。双方将充分发挥各自在技术创新、产品研发等方面的优势,共同推进Mi
对于华为来说,今年的重磅机型都已经发完了,而明年的机型已经在研发中,Pura 80就是期待很高的一款。有博主爆料称,华为Pura 80将会用上了豪威OV50K传感器,同时电池容量达到5600毫安时。至
来源:IT之家12 月 18 日消息,LG Display 韩国当地时间今日宣布,已将自行开发的“AI 生产系统”投入到 OLED 生产线的日常运行之中,该系统可提升 LG Display 的 OLE
2024年度PlayStation游戏奖今日公布,《宇宙机器人》获得年度最佳PS5游戏,《使命召唤:黑色行动6》获得年度最佳PS4游戏。在这次评选中,《宇宙机器人》获得多个奖项,包括最佳艺术指导奖、最
阿里资产显示,随着深圳柔宇显示技术有限公司(下称:“柔宇显示”)旗下资产一拍以流拍告终,二拍将于12月24日开拍,起拍价为9.8亿元。拍卖标的包括位于深圳市龙岗区的12套不动产和一批设备类资产,其中不
又一地,新型储能机会来了?■ 印度:2032储能增长12倍,超60GW据印度国家银行SBI报告,印度准备大幅提升能源存储容量,预计到2032财年将增长12 倍,超60GW左右。这也将超过可再生能源本身
极越汽车闪崩,留下一地鸡毛,苦的是供应商和车主。很多人都在关心,下一个倒下的新能源汽车品牌,会是谁?我们都没有未卜先知的超能力,但可以借助数据管中窥豹。近日,有媒体统计了15家造车新势力的销量、盈亏情
上个月,亿万富翁埃隆·马斯克谈到了年轻一代的生育问题。他强调生育的紧迫性,认为无论面临何种困难,生育后代都是必要的,否则人类可能会在无声中走向消亡。他认为人们对于生育的担忧有些过头,担心经济压力等问题