人工智能和物联网的结合为MCU开辟了新的市场,赋能越来越多的新应用和新用例,以利用简单的 MCU搭配AI加速来促进智能控制。构建基于MCU的AI解决方案有两种不同的方式。

物联网设备越来越多地采用人工智能技术来创建智能“物联网”(AIoT),这使很多应用从中受益。这些智能物联网设备从数据中学习,并在无需人工干预的情况下做出自主决策,从而使产品与其环境之间实现更合乎逻辑、更接近人类的交互。

AI和物联网的结合为MCU(微控制器)开辟了新的市场,赋能越来越多的新应用和新用例,以利用简单的 MCU搭配AI加速来促进智能控制。这些AI加持的MCU融合了DSP计算和机器学习(ML)推理能力,适合关键字识别、传感器融合、振动分析和语音识别等多种应用。更高性能的MCU还可以支持更复杂的视觉和成像应用,例如人脸识别、指纹分析和自主机器人等。

AI技术

以下是为物联网设备带来AI功能的部分使能技术:

机器学习 (ML)机器学习算法根据代表性数据构建模型,使设备能够在无需人工干预的情况下自动识别模式。ML供应商提供算法、API 和工具以构建训练模型,然后将模型植入到嵌入式系统中。输入新的数据后,这些嵌入式系统就可以利用预先训练的模型进行推理或预测,这类应用示例包括传感器融合、关键字识别、预测性维护和分类等。

深度学习(DL):深度学习是机器学习的一种,它使用多层神经网络从复杂的输入数据中逐步提取更高级别的特征和模式,从而训练系统。深度学习可以适应非常庞大、多样化和复杂的输入数据,并让系统不断迭代学习,逐步改善输出结果。其应用示例包括图像处理、客服机器人和人脸识别等。

自然语言处理 (NLP):NLP是人工智能的一个分支,可以实现系统与人类之间用自然语言进行交互。NLP帮助系统理解和解释人类语言(文本或语音),并基于此做出决策。其应用示例包括语音识别系统、机器翻译和预测性打字等。

计算机视觉:机器/计算机视觉是人工智能的一个领域,它训练机器收集、解释并理解图像数据,并根据这些数据采取行动。机器通过摄像头收集数字图像/视频,使用深度学习模型和图像分析工具准确识别和分类对象,并根据它们所“看到”的采取相应的行动。其应用示例包括制造装配线上的故障检测、医疗诊断、零售店的人脸识别和无人驾驶汽车测试等。

通过MCU实现AIoT

过去,AI属于MPU和GPU的应用范畴,它们拥有强大的CPU内核、大内存资源和进行AI分析的云连接。但近年来,随着边缘智能程度的不断提高,我们开始看到MCU被用于嵌入式AIoT应用中。向边缘转移是基于延迟和成本的考虑,同时还可以让计算处理更接近数据源。基于MCU的物联网设备具有AI功能可以实现实时决策和更快的事件响应,而且还有更多其它优势,诸如更低的带宽要求、更低的功耗、更低的延迟、更低的成本和更高的安全性。有了更高计算能力的新型MCU加持,再加上更适合资源受限MCU的瘦神经网络 (NN) 框架,AIoT得以实现。

神经网络是很多节点的集合,这些节点按层排列。每一层都接收来自前一层的输入,并根据输入的权重和偏置总和进行计算,以生成输出。输出沿其所有传出连接传递到下一层。在训练过程中,训练数据被馈入网络的第一层或输入层,每一层的输出再传递到下一层。最后一层或输出层生成模型的预测,将其与已知的预期值进行比较从而评估模型的误差。训练的过程需要在每次迭代中使用称为“反向传播”的过程完善步骤,或调整网络每一层的权重和偏置,直到网络输出与预期值密切相关。换句话说,网络从输入数据集中迭代“学习”,并逐步提高输出预测的准确性。

神经网络的训练需要极高的计算性能和内存,通常在云端进行。训练之后,这个预训练的神经网络(NN)模型被嵌入到MCU中,即可作为推理引擎对新传入数据进行处理。

1神经网络的训练与推理

这种推理生成所需要的计算性能比训练模型要低很多,在MCU上即可实现。这种预训练的神经网络模型权重是固定的,可以保存在闪存中,从而减少所需的SRAM数量,使其适用于更多资源受限的MCU。

如何在MCU上实现AIoT?

MCU上的AIoT实现包含多个步骤。最常见的实现方法是使用现有的神经网络 (NN) 框架模型之一,例如Caffe或Tensorflow Lite,它们适用于基于MCU的终端设备解决方案。用于机器学习的NN模型训练可由AI专业人员使用 AI供应商提供的工具在云端完成。NN模型优化和MCU集成可以使用AI供应商和MCU制造商提供的工具进行。推理则在MCU上采用预训练的NN模型完成。

上述过程的第一步可以完全离线完成,涉及从终端设备或应用捕获大量数据,并用于训练NN模型。模型的拓扑结构由AI开发人员定义,以充分利用现有数据并提供应用要求的输出。NN模型的训练是通过将数据集迭代传递给模型来完成的,目的是不断最小化模型输出的误差。NN框架提供的工具可以帮助完成这个过程。

在第二步中,针对特定功能(如关键字识别或语音识别)进行了优化的预训练模型被转换为适应MCU的格式。在这个过程中,首先利用AI转换器工具将模型转换为flat buffer文件,也可以选择通过量化器来转换,以减小尺寸并针对MCU优化。然后,将该flat buffer文件转换为C代码,并作为运行时可执行文件传输给目标MCU。

配备了预训练嵌入式AI模型的MCU现在就可以部署在终端设备中了。当新数据导入时,它在模型中运行,并根据训练生成推理。当新的数据类别出现时,NN模型可以被发送回云端重新进行训练,然后可以通过OTA(空中更新)固件升级将重新训练后的新模型编入MCU。

构建基于MCU的AI解决方案有两种不同的方式。为便于讨论,本文我们假设目标MCU采用Arm Cortex-M内核。

图2:通过离线预训练模型在MCU上实现AI。

在第一种方法中,转换后的NN模型在Cortex-M CPU内核上执行,并通过CMSIS-NN库加速。这是一种简单的配置,无需任何额外的硬件加速,适用于较简单的AI应用,例如关键字识别、振动分析和传感器集合等。

另一种更复杂和更高性能的选择则需要在MCU上配置NN加速器或微神经处理单元(u-NPU)硬件。这些u-NPU 可在资源受限的IoT终端设备中加速机器学习,并且可能还支持压缩以降低模型的功耗和大小。所支持的运算可以完全执行大多数常见的NN网络,以用于音频处理、语音识别、图像分类和对象检测。u-NPU不支持的网络可以回退到主CPU内核,并由CMSIS-NN库加速。在这种方法中,NN模型是在uNPU上执行的。

在配置了MCU的设备中实现AI不只有这两种方法。随着MCU的性能不断推向更高的水平,逐渐接近MPU的预期水准,我们将会看到完全的AI功能直接构建在MCU上,而且具有轻量级的学习算法和推理功能。

边缘AI才是未来

在资源受限的MCU上实现AI将在未来呈指数级增长。随着MCU性能的不断提升,MCU和MPU之间的界限越来越模糊,同时出行越来越多适用于资源受限设备的“瘦”神经网络模型,新的应用和用例将不断浮现。

未来,随着MCU性能的提高,我们将会看到除推理之外的轻量级学习算法直接在MCU上实现。这将为MCU 制造商开辟新的市场与应用,并将成为其重要的投资领域。

(参考原文:How to implement AI of Things (AIoT) on MCUs

本文为《电子工程专辑》2021年11月刊杂志文章,版权所有,禁止转载。点击申请免费杂志订阅 

责编:Luffy Liu

本文为EET电子工程专辑原创文章,禁止转载。请尊重知识产权,违者本司保留追究责任的权利。
阅读全文,请先
您可能感兴趣
紫荆半导体是一家专注于RISC-V车规级芯片设计开发的公司,公司的首颗明星产品——紫荆M100于今年9月成功点亮,并获得了功能安全认证,其采用模块化设计,内核可重构,具备更快的处理速度和更少的耗时……
晶华微发布重要公告,宣布公司拟使用自有资金2亿元收购芯邦科技持有的深圳芯邦智芯微电子有限公司100%的股权……
本报告选择汽车动力(Powertrain)与底盘(Chassis)系统中的MCU做探讨,一方面是因为,就车规MCU的角度来看,这两个组成部分更为关键、复杂,对安全性要求更高,更具实现难度;另一方面,即便是传统汽车角度,动力与底盘系统的电子控制也更加由来已久和具代表性。
瑞萨为进一步优化产品组合和加强市场拓展,发布了其最新的工业专用微处理器(MPU)RZ/T2H,并详细介绍了公司在工业市场的全面布局和未来规划。
与国产替代1.0时代不同,客户在经历过史无前例的缺芯潮之后,将供应链安全放在了更高的位置,迫切需要多源头的供货保证,加之逆变器市场现在对成本越来越在意,这一切都给国产控制类MCU的推出奠定了良好的基础。
工业和汽车领域中,马达驱动与数字电源变换是常见的实时控制系统,它们需要处理器拥有极高的实时响应能力、强大的运算能力和优质的ADC与PWM性能。而随着AI逐步渗透到工业和汽车领域,智能化变革推动着高性能微控制器(MCU)需求的日益增加。
• 目前,iPhone在翻新市场中是最热门的商品,并将长期主导着翻新机的平均销售价格。 • 全球翻新机市场持续向高端化发展,其平均销售价格(ASP)现已超过新手机。 • 新兴市场是增长的最大驱动力,消费者对高端旗舰产品有着迫切需求。 • 由于市场固化和供应链的一些问题限制推高中国、东南亚和非洲等大市场的价格。 • 2024年,这些翻新机平均销售价格将首次超过新手机。
从全球厂商竞争来看,三季度凭借多个新品发布,石头科技市场份额提升至16.4%,连续两季度排名全球第一……
2025年1月9日,美国 拉斯维加斯丨全球瞩目的国际消费电子产品展(CES 2025)盛大开幕,来自世界各地的科技巨头与创新企业齐聚一堂共同展示最新的科技成果。中国高性能微控制器产品及嵌入式解决方案提供商上海先楫半导体科技有限公司(先楫半导体,HPMicro)闪耀登场,发布了专注于机器人运动与控制的高性能MCU产品——HPM6E8Y系列,为火热的机器人市场注入新的活力。
最新Wi-Fi HaLow片上系统(SoC)为物联网的性能、效率、安全性与多功能性设立新标准,配套USB网关,可轻松实现Wi-Fi HaLow在新建及现有Wi-Fi基础设施中的快速稳健集成
来源:《中国半导体大硅片年度报告2024》2016 年至 2023 年间,全球半导体硅片(不含 SOI)销售额从 72.09 亿美元上升至121.29 亿美元,年均复合增长率达 7.72%。2016
大疆发布DJI Matrice 4T旗舰无人机,售价38888元。该无人机可用于电力巡检、应急抢险、公共安全、水利林业监测等众多应用场景。DJI Matrice 4T的镜头模组拥有“六个眼”,除了广角
近日,联想在CES 2025展会上展示了全球首款卷轴屏PC——ThinkBook Plus Gen 6。据悉,ThinkBook Plus Gen 6卷轴屏AI PC的核心魅力在于其独有的可卷曲显示屏
CES 2025,黑芝麻智能携旗下华山系列、武当系列芯片参展,并带来与产业链伙伴的合作新进展。1月8日,黑芝麻智能与汽车嵌入式互联软件产品和解决方案供应商Elektrobit联合发布了基于武当系列C1
点击蓝字 关注我们SUBSCRIBE to USImage: The Verge据悉,OpenAI已经制定了成为一家营利性公司的计划。在近日发布的一篇博客文章中,OpenAI的董事会表示,将把公司现有
当地时间2025年1月7日,全球备受期待的技术盛宴——国际消费电子展(CES 2025)在美国拉斯维加斯盛大开幕。作为显示领域的领军企业,天马携一系列前沿创新技术和最新智能座舱解决方案惊艳登场,带来手
日前,微信安卓版迎来8.0.56正式版更新,这是2025年首次版本更新。关于更新内容,依然是那9个字:“修复了一些已知问题”。虽然官方没有公布具体更新内容,但体验后发现,新版增加了朋友圈视频倍速播放等
近日,闻泰科技在一场电话会议中阐述了其出售ODM(原始设计制造)业务的战略考量。           闻泰科技表示,基于地缘政治环境变化,考虑到 ODM 业务稳健发展和员工未来发展利益最大化,公司对战
  在千级电子净化车间中设置通风系统时,需要综合考虑多个因素,包括洁净度要求、换气次数、气流组织、空气处理、温湿度控制以及节能与环保等。以下是合洁科技电子洁净工程公司的一些具体的设
这届CES,几乎成了半个车展。尤其是今年多个中国电动车品牌参展,凭借各种华丽的车载科技大放异彩,直接让美国记者看傻了。在体验完极氪001 FR之后,美国知名电动车媒体InsideEVs记者Patric