随着最近几年AI技术快速发展,数据搬运速度是运算的瓶颈,面临数据洪流,数据搬运慢、搬运能耗大等问题亟待解决。而且各类应用对算力的要求越来越高,存储墙的问题也越发明显。目前有非常多的架构出现,尝试去解决处理存储墙的问题,其中存算一体是所有新型架构中最有效的一种。

随着最近几年AI技术快速发展,数据搬运速度是运算的瓶颈,面临数据洪流,数据搬运慢、搬运能耗大等问题亟待解决。而且各类应用对算力的要求越来越高,存储墙的问题也越发明显。目前有非常多的架构出现,尝试去解决处理存储墙的问题,其中存算一体是所有新型架构中最有效的一种。

如果能使用Flash存储器完成神经网络的储存和运算,那将解决AI的存储墙问题,提高运算效率,降低成本。

在近日举办的第十一届松山湖中国 IC 创新高峰论坛上,北京知存科技带来了自主研发的新一代面向可穿戴设备的超低功耗存算一体芯片WTM2101。

据介绍,知存科技的WTM2101是国际上首个存算一体SoC芯片,另一款产品WTM1001则是首个存算一体加速器。据知存科技副总裁李想介绍,WTM2101的超低功耗存算一体特性,适用于低功耗唤醒、识别、降噪等场景,例如TWS耳机、手表等智能可穿戴设备等领域。

北京知存科技有限公司副总裁李想

基于不同的存储介质,大家在做存算一体技术的时候会采用不同的技术方向,有些是忆阻器,有些公司是用SRAM、Nor Flash,知存科技使用的就是Nor Flash技术。

Flash的存算一体技术包含Flash存储设备(拥有数个Flash存储页) 、Flash存储页 (拥有数亿个Flash存储单元)、Flash存储单元三个部分。关于知存科技为何选择Flash,李想表示:“首先,Flash工艺成熟,距离最早量产和用在设备中已有数十年时间。其次,Flash的存储密度大。”

以40nm举例,存储密度不大的情况下,用Flash存算一体技术的存储密度,比用5nm的SRAM还要高出几倍左右。另外,知存科技考虑到Flash采用的浮栅晶体管是三端的CMOS存储器,相比双端的MRAM、RRAM等其他存储器,浮栅晶体管更类似于CMOS晶体管,但比CMOS晶体管多了一个浮栅可以存储阈值电压。把流过晶体管的电流放大,使实现单个存储单元可存储8bit数据,也可以使单个存储单元可完成8bit乘法和加法。

在比较传统的冯·诺依曼架构和存算一体架构时,李想提出,传统冯·诺伊曼体系结构中的数据需要从处理单元外的存储器提取,处理完之后再写回存储器,这个过程能耗大概在60%-90%之间,能效的利用非常低,这是低功耗和高性能之间的矛盾关键点。

而存算一体芯片是新型的计算架构,使存储器同时拥有计算和存储功能,可以极大减少数据搬运过程。它的实质是一个向量矩阵的乘法,通过前端的数模转换,把输入数据转换成电流的模拟信号,当信号进入矩阵的时候,在矩阵里每个单元存一个8bit的数,比如存入3,流过晶体管,电流放大3倍,存入100,电流放大100倍,相当于横向做乘法,纵向做电流的累加,所以流过这个矩阵,相当于做一个向量矩阵的乘法。

这个矩阵适合跑AI网络,WTM2101就是基于这个技术,目标市场是耳机和手表,知存科技主要提供的是算力平台。李想表示,用在手表中会比耳机多一些健康算法。

在智能音频方面,有唤醒等功能,其中知存的VAD与市场现有方案不一样,效果以往的会更好。另外在声纹识别方面,李想谈到,现在耳机和手表还没有声纹识别的功能,基本上是用在手机上,知存的这个芯片可以将声纹识别的功能在手表和耳机等可穿戴设备中实现。

WTM2101尺寸是2.9*2.6mm,峰值算力是50Gops,能效比达到15Tops/W,最大可存1.8M的神经网络。这个芯片除了有存算一体的部分外,还有一个RISC-V内核、音频ADC和电源管理,以及丰富的接口等。

公开消息显示,北京知存科技有限公司是一家专注存算一体芯片研发的企业。创始团队从2012年开始研发存算一体芯片;2014年,知存科技的创始人在美国加州大学圣芭芭拉分校的实验室做这项技术的研发,完成过6次流片和技术验证;2016年,创始团队在完成国际第一块模拟存算一体深度学习芯片;2017年10月23日在北京注册公司,2018年3月正式开始运营;2019年底量产国际首个存算一体芯片WTM1001。

面向可穿戴领域的WTM2101目前还是样片阶段,将于2021年年底小批量试产。

据介绍,公司目前拥有80人,核心团队成员毕业于北京大学、北京航空航天大学、美国加州大学洛杉矶分校、加州大学圣芭芭拉分校等学校。核心团队成员大部分都有十年以上的行业经验。公司还自主开发的存算一体芯片量产测试流程,累计流片超过20次,截至目前,知存科技已完成3亿元产业资本领头的融资,包括中芯聚源、科讯创投、国投创业、飞图创投等。

责编:Luffy Liu

本文为EET电子工程专辑原创文章,禁止转载。请尊重知识产权,违者本司保留追究责任的权利。
阅读全文,请先
您可能感兴趣
PS1012采用了最新的第五代PCIe,与基于第四代的产品相比其带宽增大了一倍。因此,数据传输速度可达32GT/s(千兆传输/秒),顺序读取性能是以前一代规格产品的两倍,可达13GB/s(千兆字节/秒)。
SK海力士在HBM4上将对基础裸片的称呼已经从DRAM Base Die调整为Logic Base Die,强调了基础裸片愈发重要的逻辑功能。这意味着HBM4时代的基础裸片将全面转向逻辑半导体工艺。
有家存储芯片厂,今年全年的营收都在涨;持续特定存储领域No.1,究竟是怎么做到的?
继2022年和2023年行业低迷之后,市场曾普遍预期2024年将是行业反弹的起点。然而,进入2024年下半年,国内存储产业的复苏步伐意外放缓。
Rambus HBM4的控制器IP提供了32个独立通道的接口,总数据宽度可达2048位。基于这一数据宽度,当数据速率为6.4Gbps时,HBM4的总内存吞吐量将比HBM3高出两倍以上,达到1.64TB/s。与Rambus HBM3E控制器一样,HBM4内存控制器IP也是一个模块化、高度可配置的解决方案。
SK海力士NAND闪存解决方案子公司Solidigm13日宣布推出现有最大的122TB(太字节)容量NAND闪存解决方案,并基于QLC的eSSD(企业级固态硬盘)新产品“D5-P5336”。
目前,智能终端NFC功能的使用频率越来越高,面对新场景新需求,ITMA多家成员单位一起联合推动iTAP(智能无感接近式协议)标准化项目,预计25年上半年发布1.0标准,通过功能测试、兼容性测试,确保新技术产业应用。
中科院微电子所集成电路制造技术重点实验室刘明院士团队提出了一种基于记忆交叉阵列的符号知识表示解决方案,首次实验演示并验证了忆阻神经-模糊硬件系统在无监督、有监督和迁移学习任务中的应用……
C&K Switches EITS系列直角照明轻触开关提供表面贴装 PIP 端子和标准通孔配置,为电信、数据中心和专业音频/视频设备等广泛应用提供创新的多功能解决方案。
投身国产浪潮向上而行,英韧科技再获“中国芯”认可
‍‍12月18日,深圳雷曼光电科技股份有限公司(下称“雷曼光电”)与成都辰显光电有限公司(下称“辰显光电”)在成都正式签署战略合作协议。双方将充分发挥各自在技术创新、产品研发等方面的优势,共同推进Mi
对于华为来说,今年的重磅机型都已经发完了,而明年的机型已经在研发中,Pura 80就是期待很高的一款。有博主爆料称,华为Pura 80将会用上了豪威OV50K传感器,同时电池容量达到5600毫安时。至
2024年度PlayStation游戏奖今日公布,《宇宙机器人》获得年度最佳PS5游戏,《使命召唤:黑色行动6》获得年度最佳PS4游戏。在这次评选中,《宇宙机器人》获得多个奖项,包括最佳艺术指导奖、最
阿里资产显示,随着深圳柔宇显示技术有限公司(下称:“柔宇显示”)旗下资产一拍以流拍告终,二拍将于12月24日开拍,起拍价为9.8亿元。拍卖标的包括位于深圳市龙岗区的12套不动产和一批设备类资产,其中不
近期,高科视像、新视通、江苏善行智能科技等企业持续扩充COB产能。插播:加入LED显示行业群,请加VX:hangjia188■ 高科视像:MLED新型显示面板生产项目(二期)招标12月18日,山西高科
在科技浪潮翻涌的硅谷,马克·扎克伯格不仅是“脸书”帝国的掌舵人,更是以其谦逊低调的形象,在公众心中树立了独特的领袖风范。然而,在镁光灯难以触及的私人领域,扎克伯格与39岁华裔妻子普莉希拉·陈的爱情故事
今天上午,联发科宣布新一代天玑芯片即将震撼登场,新品会在12月23日15点正式发布。据悉,这场发布会联发科将推出全新的天玑8400处理器,这颗芯片基于台积电4nm制程打造,采用Arm Cortex A
点击蓝字 关注我们电网和可再生能源系统向着更智能、更高效的方向发展助力优化能源分配构建更加绿色和可靠的能源未来12 月 24 日 上午 9:30 - 11:302024 德州仪器新能源基础设施技术直播
极越汽车闪崩,留下一地鸡毛,苦的是供应商和车主。很多人都在关心,下一个倒下的新能源汽车品牌,会是谁?我们都没有未卜先知的超能力,但可以借助数据管中窥豹。近日,有媒体统计了15家造车新势力的销量、盈亏情
亲爱的企业用户和开发者朋友们距离2024 RT-Thread开发者大会正式开幕仅剩最后3天!还没报名的小伙伴,抓紧报名噢,12月21日不见不散!大会时间与地点时间:2024年12月21日 9:30-1