在日前举行的Aspencore 2024全球CEO峰会上,炬芯科技股份有限公司董事长兼CEO周正宇博士深入探讨了AI时代热潮及端侧AI所带来的新一代AI趋势,并分享了炬芯科技在低功耗端侧AI音频领域的创新技术与重磅产品。

在日前举行的Aspencore 2024全球CEO峰会上,炬芯科技股份有限公司董事长兼CEO周正宇博士发表了题为《Actions Intelligence: 端侧AI音频芯未来》的主题演讲。在演讲中,他深入探讨了AI时代热潮及端侧AI所带来的新一代AI趋势,并分享了炬芯科技在低功耗端侧AI音频领域的创新技术与重磅产品。

炬芯科技股份有限公司董事长兼CEO周正宇博士

周正宇博士指出,在从端侧AI到生成式AI的广泛应用中,不同的AI应用对算力资源的需求存在显著差异。特别是在以语音交互、音频处理、预测性维护、健康监测等为代表的AIoT领域,许多端侧AI应用是专项应用,并不需要大模型和大算力。因此,炬芯科技的目标,是“在电池驱动的中小模型机器学习IoT设备上实现高能效的AI算力,以满足IoT设备对低功耗、高能效的需求。”

针对这一目标,炬芯科技提出了“Actions Intelligence”战略,该战略聚焦于模型规模在一千万参数(10M)以下的电池驱动的低功耗音频端侧AI应用。炬芯科技致力于在10mW-100mW之间的功耗下提供0.1-1TOPS的通用AI算力,挑战目标10TOPS/W-100TOPS/W的AI算力能效比。

根据ABI Research的预测,端侧AI市场正在快速增长,预计到2028年,基于中小型模型的端侧AI设备将达到40亿台,年复合增长率为32%。到2030年,预计75%的这类AIoT设备将采用高能效比的专用硬件。

然而,现有的通用CPU和DSP解决方案在算力和能效方面远远达不到这些目标。周正宇博士分析称,传统技术的能效之所以比较差,主要源于在传统的冯•诺依曼计算架构中,存储和运算是分离的,存在“存储墙”与“功耗墙”瓶颈,严重制约系统算力和能效的提升。

为了弱化或消除这些问题,炬芯科技采用了存内计算(Computing-in-Memory,CIM)结构,其核心思想是将部分或全部的计算移到存储中,让存储单元具有计算能力,从而消除数据访存延迟和功耗,实现存储与计算的真正融合。

在选择存储介质时,考虑到单芯片集成的需求,炬芯科技采用了标准SoC适用的CMOS工艺中的SRAM和新兴NVRAM(如RRAM或者MRAM)。SRAM工艺非常成熟,且可以伴随着先进工艺升级同步升级,读写速度快、能效比高,并可以无限多次读写。可以说,短期内,SRAM是在低功耗端侧AI设备上打造高能效比的最佳技术路径。长期来看,当RRAM技术成熟以后,SRAM与RRAM的混合技术有望成为最佳技术路径。

在此基础上,炬芯科技还创新性地采用了基于模数混合设计的电路实现CIM,在SRAM介质内用客制化的模拟设计实现数字计算电路,既实现了真正的CIM,又保证了计算精度和量产一致性。这种基于模数混合电路的SRAM存内计算(Mixed-Mode SRAM based CIM,简称MMSCIM)技术路径具有显著的优势,包括比纯数字实现的能效比更高、无需ADC/DAC、数字实现的精度和量产一致性高、易于工艺升级和不同FAB间的设计转换等。

目前,炬芯第一代(GEN1)MMSCIM已经在2024年落地,采用22纳米制程,每一个核可以提供100 GOPS的算力,能效比高达6.4 TOPS/W @INT8。而在后续的产品路线图规划中我们看到:

到2025年,炬芯科技将推出第二代(GEN2)MMSCIM,性能将相较第一代提高三倍,每个核提供300GOPS算力,直接支持Transformer模型,能效比也提高到7.8TOPS/W @INT8。

2026年,推出12纳米的第三代(GEN3)MMSCIM,每个核达到1 TOPS的高算力,支持Transformer,能效比进一步提升至15.6TOPS/W @INT8。

基于MMSCIM技术,炬芯科技成功打造出了下一代低功耗大算力、高能效比的端侧AI音频芯片平台,并正式发布了三个芯片系列:面向低延迟私有无线音频领域的ATS323X、面向蓝牙AI音频领域的ATS286X、以及面向AI DSP领域的ATS362X。

这三个系列芯片均采用了CPU(ARM)+ DSP(HiFi5)+ NPU(MMSCIM)三核异构的设计架构,通过将MMSCIM和先进的HiFi5 DSP融合设计形成了炬芯科技“Actions Intelligence NPU(AI-NPU)”架构。得益于此,炬芯科技实现了既高弹性又高能效比的NPU设计。

同时,为了支持开发者更好地利用炬芯科技的AI-NPU架构,炬芯科技还打造了专用AI开发工具“ANDT”。该工具支持业内标准的AI开发流程,如Tensorflow、HDF5、Pytorch和Onnx,并可自动将给定AI算法合理拆分给CIM和HiFi5 DSP去执行。借助炬芯ANDT工具链,开发者可以轻松地实现算法的融合,并迅速完成产品落地。

在实测中,炬芯科技GEN1 MMSCIM与HiFi5 DSP在运行同样参数的Convolutional Neural Network(CNN)网络模型进行环境降噪时,MMSCIM相较于HiFi5 DSP可降低近98%功耗,能效比提升达44倍。在测试使用更复杂的网络模型进行环境降噪时,MMSCIM也表现出了显著的功耗降低和能效比提升。

周正宇博士强调指出,未来,炬芯科技将继续加大端侧设备的边缘算力研发投入,通过技术创新和产品迭代,实现算力和能效比进一步跃迁,提供高能效比、高集成度、高性能和高安全性的端侧AIoT芯片产品,推动AI技术在端侧设备上的融合应用,助力端侧AI生态健康、快速发展。

责编:Lefeng.shao
本文为EET电子工程专辑原创文章,禁止转载。请尊重知识产权,违者本司保留追究责任的权利。
阅读全文,请先
您可能感兴趣
“寻找算力与能效的极限”,很像中国哲学思想里对“知”和“行”的一些认识,毕竟“极限”是目标,是要寻找和前行的方向。在2024全球CEO峰会的圆桌论坛环节中,与会嘉宾围绕该主题展开了深入讨论。
作为一家功率半导体厂商,在“碳中和”中往往要扮演好两个角色。一是自身生产运营中的降碳,另一个更重要,是用自己的产品去助力其他企业、行业实现节能降碳。
哪些新兴技术将成为未来半导体行业的关键驱动力?哪些市场会带来新的应用机会?芯片公司和上游的EDA/IP厂商将面临什么样的新挑战,又将如何应对?……整个产业界迫切想要得到的答案,或许可以在这里找到。
由全球电子技术领域知名媒体集团AspenCore主办的“国际集成电路展览会暨研讨会”(IIC Shenzhen 2023)于2023年11月2日在深圳大中华交易广场重磅启幕。同时,由AspenCore全球资深产业分析师组成的评审委员会以及来自亚、美、欧洲的网站用户群共同评选出了2023年“全球电子成就奖” (World Electronics Achievement Awards) 获奖者……
Blind表示今年美国企业员工在高通膨环境下最在意的就是工作稳定,因此企业裁员严重影响CEO满意度。因此,今年大规模裁员的企业CEO都在这次排名中吊车尾……
在2022年深圳国际集成电路展览会暨研讨会(IIC Shenzhen)上,全球CEO峰会的压轴环节是圆桌讨论。本次圆桌讨论的主题是全球半导体周期变数及应对策略
本研究通过设计闪存存算一体架构,有效提升了计算效率和精度,为解决复杂计算任务提供了重要技术支撑。
日本两大全球汽车集团本田与日产于2024年12月23日宣布启动合并谈判,目标在2025年6月达成协议,三菱汽车也有望加入。若三家车厂顺利合并,当务之急将是整合各自的资源以节省开支,利用规模化生产降低成本,以及加快电动车相关计划......
芯联集成与广汽埃安共建联合实验室,将共同推动汽车半导体技术研发创新,为智能电动汽车注入新活力。
美芯晟最新推出全集成精确直接飞行时间测距的dToF传感器MT3801,基于单光子飞行时间进行精确测距,测距范围支持到5m,同时集成SPAD、算法处理模块、Cortex M0内核和940nm VCSEL及光学滤光片,可广泛应用于手机/Pad、扫地机、吹风机、水龙头、智能马桶、投影仪、无人机等领域。
点击上面↑“电动知家”关注,记得加☆“星标”!电动知家消息,1月2日,赛力斯集团董事长(创始人)张兴海向全体员工发布题为《一个目标干到底》的新年寄语。张兴海指出,2024年是具有里程碑意义、转折性意义
点击上面↑“电动知家”关注,记得加☆“星标”!电动知家消息,北京时间2025年1月2日晚,特斯拉发布2024年第四季度及全年生产与交付报告。数据显示,特斯拉2024年全年销量为179万辆,较2023年
点击上面↑“电动知家”关注,记得加☆“星标”!电动知家消息,2025年1月2日,网传一张聊天记录显示,极越汽车“创业2.0”要来了。消息称,1、夏老板(极越汽车CEO夏一平)来开会组建2.0团队,各部
芝能科技出品在CES2025前,我们探讨一下机器人 AI 技术,阐述其定义、所需数据与算力及产品迭代路径,并详细分析人形机器人发展瓶颈。研究发现,机器人 AI 是实现机器人智能交互与自主决策的关键,其
点击左上角“锂电联盟会长”,即可关注!科学背景由于锂离子电池比石墨具有更高的比容量,因此与锂离子电池相比,锂金属电池(lmb)具有更高的体积和重量能量密度。在液态下, 锂枝晶沉积和电池短路的问题一直难
Omdia观点: 5G-A促进对用户想要的和会为之付费的服务的了解。调查的受访者将速度(即“更快的速度”、“高端下载速度”和“速度加速”)作为他们愿意支付更多的前三项5G功能(见右侧Omdia的《20
点击上方“C语言与CPP编程”,选择“关注/置顶/星标公众号”干货福利,第一时间送达!最近有小伙伴说没有收到当天的文章推送,这是因为微信更改了推送机制,导致没有星标公众号的小伙伴刷不到当天推送的文章,
点击左上角“锂电联盟会长”,即可关注!快科技1月1日消息,2024年,理想汽车捷报频传。12月交付58513辆,创历史新高。截至2024年12月31日,理想汽车2024年共交付500,508辆,历史累
直播报名入口电脑端复制到浏览器:https://www.fanyedu.com/live/275.html⇩手机端识别下方二维码报名直播⇩直播时间2025年1月3日 晚8点直播介绍在我们进行PCB设计
近日,由国家科学技术奖励工作办公室审核并备案(奖励编号:0319)的“云计算中心科技奖”正式揭晓,艾特网能高密智算风冷悬浮多联热管空调系统荣膺“云计算中心科技奖·卓越奖”,这是艾特网能继北斗iBloc