随着最近几年AI技术快速发展,数据搬运速度是运算的瓶颈,面临数据洪流,数据搬运慢、搬运能耗大等问题亟待解决。而且各类应用对算力的要求越来越高,存储墙的问题也越发明显。目前有非常多的架构出现,尝试去解决处理存储墙的问题,其中存算一体是所有新型架构中最有效的一种。

随着最近几年AI技术快速发展,数据搬运速度是运算的瓶颈,面临数据洪流,数据搬运慢、搬运能耗大等问题亟待解决。而且各类应用对算力的要求越来越高,存储墙的问题也越发明显。目前有非常多的架构出现,尝试去解决处理存储墙的问题,其中存算一体是所有新型架构中最有效的一种。

如果能使用Flash存储器完成神经网络的储存和运算,那将解决AI的存储墙问题,提高运算效率,降低成本。

在近日举办的第十一届松山湖中国 IC 创新高峰论坛上,北京知存科技带来了自主研发的新一代面向可穿戴设备的超低功耗存算一体芯片WTM2101。

据介绍,知存科技的WTM2101是国际上首个存算一体SoC芯片,另一款产品WTM1001则是首个存算一体加速器。据知存科技副总裁李想介绍,WTM2101的超低功耗存算一体特性,适用于低功耗唤醒、识别、降噪等场景,例如TWS耳机、手表等智能可穿戴设备等领域。

北京知存科技有限公司副总裁李想

基于不同的存储介质,大家在做存算一体技术的时候会采用不同的技术方向,有些是忆阻器,有些公司是用SRAM、Nor Flash,知存科技使用的就是Nor Flash技术。

Flash的存算一体技术包含Flash存储设备(拥有数个Flash存储页) 、Flash存储页 (拥有数亿个Flash存储单元)、Flash存储单元三个部分。关于知存科技为何选择Flash,李想表示:“首先,Flash工艺成熟,距离最早量产和用在设备中已有数十年时间。其次,Flash的存储密度大。”

以40nm举例,存储密度不大的情况下,用Flash存算一体技术的存储密度,比用5nm的SRAM还要高出几倍左右。另外,知存科技考虑到Flash采用的浮栅晶体管是三端的CMOS存储器,相比双端的MRAM、RRAM等其他存储器,浮栅晶体管更类似于CMOS晶体管,但比CMOS晶体管多了一个浮栅可以存储阈值电压。把流过晶体管的电流放大,使实现单个存储单元可存储8bit数据,也可以使单个存储单元可完成8bit乘法和加法。

在比较传统的冯·诺依曼架构和存算一体架构时,李想提出,传统冯·诺伊曼体系结构中的数据需要从处理单元外的存储器提取,处理完之后再写回存储器,这个过程能耗大概在60%-90%之间,能效的利用非常低,这是低功耗和高性能之间的矛盾关键点。

而存算一体芯片是新型的计算架构,使存储器同时拥有计算和存储功能,可以极大减少数据搬运过程。它的实质是一个向量矩阵的乘法,通过前端的数模转换,把输入数据转换成电流的模拟信号,当信号进入矩阵的时候,在矩阵里每个单元存一个8bit的数,比如存入3,流过晶体管,电流放大3倍,存入100,电流放大100倍,相当于横向做乘法,纵向做电流的累加,所以流过这个矩阵,相当于做一个向量矩阵的乘法。

这个矩阵适合跑AI网络,WTM2101就是基于这个技术,目标市场是耳机和手表,知存科技主要提供的是算力平台。李想表示,用在手表中会比耳机多一些健康算法。

在智能音频方面,有唤醒等功能,其中知存的VAD与市场现有方案不一样,效果以往的会更好。另外在声纹识别方面,李想谈到,现在耳机和手表还没有声纹识别的功能,基本上是用在手机上,知存的这个芯片可以将声纹识别的功能在手表和耳机等可穿戴设备中实现。

WTM2101尺寸是2.9*2.6mm,峰值算力是50Gops,能效比达到15Tops/W,最大可存1.8M的神经网络。这个芯片除了有存算一体的部分外,还有一个RISC-V内核、音频ADC和电源管理,以及丰富的接口等。

公开消息显示,北京知存科技有限公司是一家专注存算一体芯片研发的企业。创始团队从2012年开始研发存算一体芯片;2014年,知存科技的创始人在美国加州大学圣芭芭拉分校的实验室做这项技术的研发,完成过6次流片和技术验证;2016年,创始团队在完成国际第一块模拟存算一体深度学习芯片;2017年10月23日在北京注册公司,2018年3月正式开始运营;2019年底量产国际首个存算一体芯片WTM1001。

面向可穿戴领域的WTM2101目前还是样片阶段,将于2021年年底小批量试产。

据介绍,公司目前拥有80人,核心团队成员毕业于北京大学、北京航空航天大学、美国加州大学洛杉矶分校、加州大学圣芭芭拉分校等学校。核心团队成员大部分都有十年以上的行业经验。公司还自主开发的存算一体芯片量产测试流程,累计流片超过20次,截至目前,知存科技已完成3亿元产业资本领头的融资,包括中芯聚源、科讯创投、国投创业、飞图创投等。

责编:Luffy Liu

本文为EET电子工程专辑原创文章,禁止转载。请尊重知识产权,违者本司保留追究责任的权利。
阅读全文,请先
您可能感兴趣
由于供应过剩,SK Hynix计划在上半年将其NAND闪存产量减少10%,NAND闪存价格已经连续四个月下跌,SK Hynix的减产举措反映了对当前市场环境的应对策略......
三星在 HBM3E市场落后于SK Hynix,正计划通过采用先进工艺最大限度地提高 HBM4 的性能。三星电子的存储业务部门成功完成了HBM4内存逻辑芯片的设计,并交由Foundry业务部采用4nm工艺进行试产......
SK海力士将在CES2025,展出HBM、企业级固态硬盘(eSSD)等面向AI的代表性存储器产品,也将展示专为端侧AI优化的解决方案和下一代面向AI的存储器产品。
PS1012采用了最新的第五代PCIe,与基于第四代的产品相比其带宽增大了一倍。因此,数据传输速度可达32GT/s(千兆传输/秒),顺序读取性能是以前一代规格产品的两倍,可达13GB/s(千兆字节/秒)。
SK海力士在HBM4上将对基础裸片的称呼已经从DRAM Base Die调整为Logic Base Die,强调了基础裸片愈发重要的逻辑功能。这意味着HBM4时代的基础裸片将全面转向逻辑半导体工艺。
有家存储芯片厂,今年全年的营收都在涨;持续特定存储领域No.1,究竟是怎么做到的?
对于未来行业发展的增长趋势、行业特征和渠道特点等方面,IDC 总结并给出了2025年中国PC 显示器市场十大洞察……
该存内计算芯片采用全数字设计,能够保证不同位宽配置下的精确计算。为实现不同位宽配置下的高利用率和高能效,团队提出了一种……
西门子数字化工业软件在IDC MarketScape发布的《2024 – 2025全球制造执行系统供应商报告》中被评为MES领导厂商,该报告针对制造业的MES软件厂商进行了综合性评估。
Arm宣布其芯粒系统架构 (CSA) 正式推出首个公开规范,进一步推动芯粒技术的标准化,并减少行业的碎片化。
根据知名数码博主“智慧皮卡丘”透露,今年即将发布的华为Pura80 Ultra将采用自研三摄系统,瞄准影像手机Top1。据悉,华为Pura80 Ultra将采用全新的自研影像软硬架构,后置影像系统由一
知识酷Pro 👆学显示行业知识找小酷!第1833篇推文据悉,Micro LED正作为光通信、增强现实与虚拟现实以及可穿戴设备的下一代显示技术崭露头角。金属卤化物钙钛矿因其高效的发光能力、长程载流子传输
动动手指,关注公众号并加星标哦(1)推导MOS管的I/V特性的时候,基本主要是基于下面这三个公式。在文献[1][2][3]中,三个公式中的正负号,作者都安排的不太一样。虽然,这正负号在这三个等式中乱窜
对于点击上面↑“电动知家”关注,记得加☆“星标”!电动知家消息,针对近期引起广泛关注的订单造假等传闻,乐道汽车副总裁、用户运营及服务运营负责人夏庆华1月23日中午在朋友圈发文回应表示,乐道品牌从上市开
2025年的CES(美国国际消费电子展)上,宝马发布了全新一代超感智能座舱,全景iDrive和操作系统X。一家以运动驾控著称的传统汽车品牌,竟会在大型消费类电子产品展会上发布智能化产品?没错,宝马就是
现货促销让采购/更简单/更高效为了更好地帮助大家采购芯片,实现供需资源的无缝对接。AMEYA360决定开启【现货促销】专栏,通过AMEYA360微信公众号,每天推送原厂现货促销物料,助力广大用户制定更
蛇年大吉旧年辞暮  万物启新瑞蛇迎春  喜气盈门辞旧迎新之际ZLG限定红包封面承载着ZLG致远电子满满心意悄然登场祝大家  2025年勇攀高峰  “蛇”我其谁蛇年吉祥  巳巳如意点击领取红包封面(数量
 智能汽车网络与数据安全新媒体 (谈思汽车讯)据国家市场监督管理总局官方微信公众号“市说新语”消息,近期,由我国联合德国、日本、韩国、英国等国共同研制的多项智能网联汽车国际标准提案在国际标准化组织(I
行业观点STANDPOINT▙▖❙▗❘▖▝▚▘⁎⁑⁂⁑    1 月 22 日晚间消息,多家媒体消息,美的集团董事长兼总裁方洪波在内部签发了一项引人瞩目的《关于简化工作方式的要求》文件。    此文件
 智能汽车网络与数据安全新媒体 AutoSec Europe 2025随着汽车网络与数据安全进入强监管时代,中国车企作为欧盟市场上的重要玩家,如何才能更好地合法合规开展业务?怎么样面对不同部门甚至国家