这半年我们常听到AI MCU这个词,微控制器究竟是怎么和AI扯上关系的?

即将在本周四(7月25日),于深圳君悦酒店举办的2024全球MCU及嵌入式生态发展大会的论坛议程中,我们看到包括MCU大会的圆桌讨论主题AI+MCU,以及电机驱动与控制论坛部分嘉宾都将以AI为讨论主题...

MCU这类微控制器竟也开始和AI挂钩了吗?点击这里报名参会了解详情,国际和本土知名MCU厂商的技术和应用专家都将参与——这将是了解AIoT生态发展情况的好时机。

在TinyML这个词火了以后,边缘AI的活跃气氛就延烧到了MCU领域。比如在去年的进博会上,瑞萨展示了一个demo,凭藉MCU,摄像头就能检测画面中的人,检测距离能达到20米——当时瑞萨介绍说各种光线和环境都没问题。而在前不久英飞凌的媒体沟通会上,英飞凌展示用MCU+microNPU,甚至能识别画面中的水果品种。

这样的场景放在过去是完全不可想象的。MCU的“AI化”,大概也真正标志着边缘AI的全面来袭。本文借助3款典型的MCU产品,来谈谈AI MCU的边缘应用和发展情况。

 

MCU走向AI的标准答案:GD32H7

在我们看来,MCU走向AI应用的标准答案是兆易创新GD32H7系列。该系列MCU采用Arm Cortex-M7内核,所以被兆易创新称作“超高性能微控制器”。兆易创新表示,相比采用Cortex-M4内核的MCU,该系列产品性能提升40%,相比于M3则提升了多达70%。

Cortex-M7本身是个6级超标量流水线设计的核心,可选配FPU单精度和双精度单元,指令和数据总线扩大到64bit。具体到GD32H7产品,600MHz主频Cortex-M7内核,存储资源1MB SRAM+最大4MB Flash,加速器包含有DSP、FPU、硬件TMU(三角函数加速器)、FAC(滤波算法加速器)等;

其外设资源则有4个USART、4个UART、4个I²C、6个SPI、4个I²S、2个SDIO和1个MDIO,支持3路CAN-FD和2路以太网,支持USB 2.0 FS和HS通信。

去年发布这颗MCU时,兆易创新就提到其适配的应用包括复杂计算、多媒体处理、边缘计算、ML/AI算法等。去年慕展上,搭配内置的TFT-LCD控制器和IPA(Image Processing Accelerator),兆易创新展示基于GD32H7的GUI开发演示套件,直接就能进行HMI图形触控交互——作为一颗MCU,这种表现还是相当突破认知的。

而AI/ML部分,关键还是在于核心的高主频、存储资源给足,以及配套加速器。这显然算得上是MCU走向AI、应用AI的标准答案了。此前兆易创新给出的AI应用示例包括语音、人脸、姿势和指纹等人机交互生物特征识别;存在检测及人头数判断等。

今年慕展上,兆易创新展示了两个比较具有代表性的应用。其一是AI直流拉弧检测方案(下图):基于GD32H7,采用兆易创新自研的AI算法进行直流拉弧检测。慕展现场兆易创新的工程师介绍说,GD32H7能够在500K采样率下支持12路ADC通道的拉弧检测、实时AI推理,CNN模型的大小1.7KB,单次推理耗时不超过0.6ms,也就能够对电弧进行即时响应。

值得一提的是,兆易创新面向开发者提供数据采集工具和一键训练工具。前者用于采集电弧信号和正常信号,也具备对已部署模型进行检测评估的功能;后者则训练并生成拉弧检测AI模型,还支持一键生成可编译、运行的电弧检测代码。另外搭配外围的存储和通信模块,可以将采集的数据传输到云,并进行训练,以及模型参数的OTA升级。

还有个演示demo是AI语音识别方案:采用Sensory平台进行关键词训练,支持多关键词、多语种的训练;自然也支持训练模型在MCU端侧部署,在本地运行轻量化语音识别模型;功能方面,支持人声检测、语音降噪、音频分割、MFCC特征提取等。

 

另一个解题思路:Helium

在形如兆易创新这样的AI MCU标准答案之外,还有一些解题思路,典型如Arm Helium。文首提到瑞萨在去年进博会上展示的RA8系列MCU,能直接检测画面中的人(如下图),是不需要借助额外的加速器了。更有一种MCU竟可以进行AI计算且效果还不错的既视感。

瑞萨RA8采用Arm Cortex-M85首先也决定了这是颗性能彪悍的MCU,包括Arm v8.1-M内核,不同精度浮点数硬件支持及每周期数学性能提升,和表现在CoreMarks/MHz数字上相较于其他Cortex-M系列核心的领先。具体到RA8M1,也有1MB SRAM、2MB Flash,通信接口亦支持以太网、USB、CAN-FD等,还有Octal SPI可接Octal Flash或HyperRAM。

此前的采访中,瑞萨还提到RA8系列MCU也针对图形显示和外设功能进行了优化,能够更好地满足楼宇自动化、家用电器、智能家居等领域的需求,“特别是在图形显示和语音/视觉多模态AI应用方面”;加上强调安全性,RA8还适用于消费电子、医疗设备等。

不过这其中相关AI的关键,还在于Cortex-M85对于Arm Helium的支持,令M85的DSP/ML性能提升4倍、标量性能提升30%。用一句话总结Helium,这种技术很像是Cortex-M版本的Neon,但又考虑到了嵌入式系统成本与功耗敏感的特性。

Helium是Cortex-M系列的MVE矢量指令集扩展,主要为机器学习和DSP应用提供性能支持。Arm在资料中说Helium是在小型处理器内实现有效信号处理的全新设计,其中包含了不少新的架构特性,用以加强嵌入式使用场景中的计算性能,兼顾到面积和功耗——相当于把Neon能力(Cortex-A的SIMD指令)带到了M-Profile架构。

所以Helium设计的目标,是用单颗处理器取代以往某些需要搭配DSP的方案。瑞萨在发布RA8之时就说这么做填补了市场空白,因为这么做简化了软件开发、降低了芯片设计的复杂性和成本。前不久,我们就Helium技术实现撰文做过专门介绍,对其实现感兴趣的读者可以前往查看。

Helium和Neon都是128-bit矢量size,用浮点单元的寄存器作为矢量寄存器,也都有对应的一些矢量处理单元。但二者区别在于,Helium在设计理念上考虑对现有硬件资源的最大化利用,比如128bit数据通路是借助beatwise执行实现的,用的矢量寄存器也少于Neon;配套所谓的beatwise执行也有一系列指令、数据访存等改进...

这是凭藉RA8 MCU,就实现人检测,不需要其他加速器的关键。瑞萨的这一demo是与PlumerAI合作完成的。另外瑞萨此前还在进博会上演示了马达异常检测AI套件,借助Reality AI工具,进行电机运行的数据分析采集,生成的AI模型可进行电极异常检测。

在开发生态方面,除了配套AI/ML工具及开发套件,瑞萨也构建了AI/ML“应用公园”,包含解决方案套件、工具箱、应用实例和参考设计。比如瑞萨此前收购的Reality AI就能为非视觉类应用提供AI开发工具,包括为客户提供定制AI模型。

 

还能配套NPU加速器

Helium对于有实时响应和超低功耗要求的应用而言,是相当不错的选择,而且MCU的特性也决定了开发的友好性。如果嵌入式应用追求更高的AI性能,很多市场参与者也开始为MCU配套AI加速器。比较具有代表性的是英飞凌前不久更新的PSOC MCU产品线,其中的PSOC Edge系列就强化了AI能力。

此系产品线中除了PSOC Edge E81的机器学习加速主要是基于Helium和英飞凌NNLite加速器,着眼于更低功耗的ML应用;E83/E84搭配的是Arm Ethos-U55 NPU。Arm在Ethos-U55的产品宣传页上就提到其AI性能提升了480倍,AI应用实现过程中0.1mm²面积就节约至多90%能耗。

上个月的媒体沟通会上,英飞凌展示了一个水果种类识别的demo——以前这是2.4GHz频率的x86 CPU才能干的活儿。PSOC Edge产品线现有芯片主要基于Cortex-M55微控制器内核,搭配Ethos-U55,就能相对轻松地对应这一场景。在400MHz主频下,推理时间约41.68ms。

另一则demo小游戏,是借助毫米波雷达(XENSIV)检测手势,手势操控屏幕上的火箭安全着陆(下图)。这则demo除了体现基于机器学习来识别手势点云数据,另外也体现了PSOC Edge E84的低功耗2D图形加速能力。

值得一提的是,为了让PSOC Edge能够适配电池驱动设备——如可穿戴产品,英飞凌为其加入了低功耗模式——always-on电源域涵盖LPPASS(低功耗可编程模拟子系统)、与传感器通信的SCB(串行通信总线),在系统进入深睡模式时仍可保持工作,实现always-on的传感和响应。

搭配英飞凌去年收购Imagimob获得AI软件方面的能力,结合Modus Toolbox工具,英飞凌也因此提供“端到端”机器学习开发能力,从数据到模型部署。英飞凌在采访中提到,其软件、解决方案最能体现英飞凌MCU的差异化竞争优势。

英飞凌定位PSOC E8x系列目标应用包括家电与工业设备中的HMI、智能家居、安全系统、机器人与可穿戴设备。其中E83/E84因为特别配了NPU,也就具备ML唤醒、视觉位置检测与人脸/物体识别特性。

英飞凌认为,未来万物互联都需要具备机器学习能力,除了像PSOC Edge这样强调AI能力的产品,“我们会看到PSOC Control和PSOC Connect最终也将具备机器学习能力”——PSOC Control是主要用于电机控制和功率转换的MCU系列,PSOC Connect则融入了无线连接特性。这也很好地体现了AI everywhere的趋势和潜力。

去年的采访中,瑞萨提到随着边缘和端侧AI的普及,应用开发理念也和过去完全不同。“可能开发者思考的不再是用什么样的算法来实现功能,而是有多少实用的数据来实现对应的算法”,因此数据成为关键,“数据会在未来的开发流程中占据重要位置”,AIoT开发理念因此更多转向以数据为中心。

过去这大半年我们看到越来越多的市场参与者推出AI MCU产品。无论是搭配专门的加速器,还是借助Helium以及高性能微控制器核心、丰沛的存储资源加强AI能力,这方面的市场需求显然正变得旺盛。英飞凌就认为边缘AI还将经历长期发展,而现在只是个开端。

了解更多有关AIoT及MCU生态发展情况,关注由Aspencore主办的2024全球MCU及嵌入式生态发展大会——包括安谋科技、瑞萨、兆易创新、芯易荟等在内的生态上下游企业都将参与本次盛会 >>点击这里报名参会<<

大会议程:

责编:Illumi
本文为EET电子工程专辑原创文章,禁止转载。请尊重知识产权,违者本司保留追究责任的权利。
阅读全文,请先
您可能感兴趣
DF30芯片是业界首款基于自主开源RISC-V多核架构、采用国内40nm车规工艺开发的高端车规MCU芯片。该芯片实现了全流程国内闭环,功能安全等级达到了ASIL-D,并已通过295项严格测试。
意法半导体在第三季度继续保持了稳定的增长,尤其是在汽车产品和分立器件产品部表现出色。然而,模拟器件、MEMS和传感器产品部的收入下滑值得关注。公司对第四季度的展望较为保守,反映了对市场不确定性的谨慎态度。
尽管思瑞浦在模拟混合信号设计方面拥有丰富经验,其MCU产品在市场上的表现并不理想。究其原因,是因为国内MCU领域竞争已经非常激烈,产品同质化严重,企业之间的竞争主要集中在性价比上,导致利润空间被严重压缩。
由于成本和时间问题,路透社报道称,OpenAI公司暂时放弃了雄心勃勃的代工计划,转而计划专注于内部芯片设计工作。作为芯片的最大买家之一,OpenAI 在开发定制芯片时决定从不同的芯片制造商处采购,这可能会对科技行业产生更广泛的影响......
众所周知,FD-SOI工艺停留在22nm已经很久了,直到意法半导体和三星联合推出18FDS才打破了这一沉寂。除此之外,目前有明确进一步发展更先进工艺的,只有格罗方德的12FDX(12nm),但还未推出。在到达22nm之后,FD-SOI工艺是否有必要继续推进到12nm呢?
当前全球FD-SOI技术的主要参与者包括Soitec、GlobalFoundries、三星电子、意法半导体等公司,它们在FD-SOI技术的研发和商业化方面投入了大量资源,目前行业的进展如何?
为了更直观地了解FinFET到GAAFET架构世代的差异,本文利用高倍率的电子显微镜影像进行深入的探讨与分析,观察其于结构微观层面上的特征...
汽车技术领域正处于关键的转折点,其未来依托于动态且适应性强的系统,并可通过软件不断提升驾驶体验。
连接标准联盟很高兴宣布 Matter 1.4 现已正式发布,可供设备制造商和生态平台开发应用。这次更新是Matter生态系统迈出的重要一步。Matter 1.4带来了一系列增强功能......
根植雄厚研发实力及物联网领域的深耕实践,汇顶科技面向新兴车载互联应用全力进击。旗下首款高可靠性、高性能车规级低功耗蓝牙SoC——GR5405,已成功通过AEC-Q100 Grade 2认证。
国芯网[原:中国半导体论坛] 振兴国产半导体产业!   不拘中国、放眼世界!关注世界半导体论坛↓↓↓11月12日消息,据路透社看到的草案,日本政府计划提出一个耗资 10 万亿日元的计划,在“数年”时间
据行家说Research调研信息显示,2024年,LED一体机市场出货量呈现增长态势,尤其海外市场推广力度加强;同时,多家厂商对2025年的市场增长持乐观态度,并积极布局LED一体机产品。近日,创维商
全新产品几乎适用于任何应用,大幅减少元件数量、BOM成本和占板空间   瑞萨电子今日宣布,推出全新AnalogPAK™ IC系列,其中包括低功耗——SLG47001/
互联网与科技企业每日重点资讯文 | 苏丁巨头动向歌尔股份被曝成为苹果2026年两款新品供应商天风国际分析师郭明錤爆料称,苹果将首次进军智能家居IP Camera(网络摄像头)市场,计划2026年量产,
近几年,越来越多的中国电子零部件企业将目光投向海外市场,寻求“出海”机会。有一家坐落于深圳龙岗坂田的企业,在高端豪华车、工业控制上的产品成功获得了行业标杆客户的订单,出口额更是突破百万美元,成为“出海
今天,万众瞩目的德国慕尼黑电子展开始了。这次慕展很有可能会是史上规模最大的一次慕展!三星、博通、TI、ST、ADI、Infineon、NXP、ON、高通、Skyworks、TDK等众多芯片大厂,艾睿、
芯片超人现有1600平米芯片智能仓储基地,现货库存型号1000+,品牌高达100种,5000万颗现货库存芯片,总重量10吨,库存价值高达1亿+。同时,芯片超人在深圳设有独立实验室,每颗物料均安排QC质
ABOUT US研鼎公司总部位于上海浦东张江高科技园区,在深圳、北京和韩国设立研发和运营。是影像测试设备与解决方案领军企业,致力于视觉测试设备和分析软件产品的研发,可为客户提供优质的影像实验室Turn
中国新能源车市场的变化速度用“日新月异”来形容毫不夸张,短短几年时间,车企们的发力方向就从“冰箱彩电大沙发”的卷配置,到猛堆电池的卷续航,再到蜂拥而上卷智能化。各种方向的技能树都没少点,但由于补能效率
近日,市场中有关“美国商务部要求台积电暂停对中国大陆AI芯片企业供货7nm及以下芯片代工服务”的消息不断蔓延。台积电于11月8日表示:作为一家守法的公司,一向致力于遵循所有可适用的法令与法规,包括可适