技术创新通常会在几十年内掀起改变人类生活的浪潮:电力、计算机、互联网。最近的浪潮是人工智能 (AI)。自诞生以来,人工智能主要局限于大型计算平台。然而,先进处理器技术和高效人工智能网络的融合带来了突破性创新,使人工智能可以在嵌入式系统中运行。这些系统通常配备专门的人工智能专用处理器和支持机器学习的传感器,可实现前所未有的“边缘”功能。
这些功能使预测性维护达到了新的水平。嵌入式人工智能加速技术可防患于未然,而无需人工参与。本文将介绍几种可在边缘实现人工智能算法的新型处理器技术。
支持人工智能的微控制器和 MEMS 传感器是预测性维护人工智能革命的前沿。这些设备的特点是体积小、功耗低,并且能够加速与人工智能相关的特定数学函数。传统的嵌入式处理器与人工智能内核和/或传感器模块相结合,使设备能够实时分析和响应现实世界中基于时间序列的数据。在时间序列数据应用中实现嵌入式人工智能有多种方法。但首先…
时间序列数据分析涉及了解数据中的模式、趋势、异常和行为。人工智能可用于对未来值进行观察或预测,从数据中提取真知灼见,为决策提供依据。这类分析可以使用人工智能网络来完成,这就需要了解和选择处理硬件。
在预测性维护、环境异常检测、物联网设备、多轴运动等应用中,时间序列数据可用于了解数据中的模式、趋势和行为。利用卷积神经网络、递归神经网络、长短期记忆网络和门控递归单元等人工智能算法,时间序列数据可用于检测预期结果或异常结果。虽然这些机器学习算法可在通用硬件上执行,但使用带有人工智能内核的处理器和/或传感器可减少延迟并提高效率。
Nanoedge AI Studio 显示来自电机控制
应用程序的时间序列数据
具有机器学习功能的微控制器
Cortex-M 系列微控制器 (MCU)(从 M0 到 M85)通常是各种应用中嵌入式系统处理的支柱,无论是否执行人工智能。不过,由于这些内核专为低功耗、实时数据处理而设计,因此非常适合嵌入式人工智能硬件解决方案。
例如,采用 32 位 Arm Cortex-M33 的 STMicroelectronics STM32L5 和 NXP MCX-A MCU 都适用于使用简单人工智能网络的嵌入式系统。虽然这些传统的 Cortex-M 内核在处理传感器数据和简单的人工智能处理方面表现出色,但对于更复杂的机器学习任务,让我们来看看集成了更多内核以进一步实现机器学习的微控制器。
图形处理器 (GPU)
虽然 GPU 主要用于提高 2D(有时是 3D )图形性能,但越来越多的嵌入式人工智能应用将 GPU 与 Cortex-M MCU 结合使用。这些并行处理单元可用于深度学习算法,如卷积神经网络 (CNN),以完成图像识别和物体检测等任务。例如,STM32U5 采用 Cortex-M33 和 NeoChrome GPU,适合工业、智慧城市、智能家居和物联网应用中的人机界面应用或嵌入式人工智能解决方案。
神经处理单元 (NPU)
神经处理单元 (NPU) 是高度专业化的内核,为加速神经网络计算而进行了优化,使程序能够在功能上自我学习和重新编程。这些内核通常与 Cortex-M 处理器一起实现,能够执行比标准 Cortex-M 内核单独运行时更复杂的神经网络算法。
例如,NXP 的 MCX-N 结合了 Arm Cortex-M33 和定制的 eIQ 神经处理单元。Alif Semiconductor 的 Ensemble 系列是可用于工业应用的微控制器,将 Arm Cortex-M55 CPU 与 ARM Ethos-U55 神经处理单元实现的专用边缘人工智能加速相结合。该系列可提供单 Cortex-M55 或双 Cortex-M55、单 Ethos-U55 或双 Ethos-U55,以及可选的一个或两个 Cortex-A32 MPU 内核。
通过将人工智能任务卸载到 NPU,嵌入式系统可以实现实时神经网络推理,同时节省功耗、体积和资源。
带有嵌入式人工智能内核的传感器
如上所述,嵌入式人工智能应用通常使用标准 MCU 进行数据处理的计算。然而,新的传感器技术已将人工智能处理移至 MCU 外部,并将嵌入式人工智能处理内核置于传感器本身,称为机器学习内核 (MLC) 和智能传感器处理单元 (ISPU)。
带有嵌入式机器学习核心 (MLC) 的传感器可以经过训练,在检测到特定事件时触发操作,从而能够精确检测变化场景。这样可以减少 MCU 的计算负荷,从而实现低功耗架构并提高系统效率。例如,LSM6DSV16BXTR 是一款带有 3 轴加速计和 3 轴陀螺仪的 IMU,它采用 MLC 来实现人工智能功能。
结论
将人工智能应用于时间序列数据是一个令人兴奋的发展领域,有可能为工业、医疗保健和消费应用增加智能。开发人工智能解决方案需要考虑很多因素,选择处理器只是其中之一。