嵌入式AI技术漫谈|深度学习的困局

瑞萨MCU小百科 2025-04-02 18:01


作者:苏勇Andrew



使用神经网络实现机器学习,网络的每个层都将对输入的数据做一次抽象,多层神经网络构成深度学习的框架,可以深度理解数据中所要表示的规律。从原理上看,使用深度学习几乎可以描述和模拟一切规律,但实际上,这个过程效率非常低,需要消耗大量的存储空间描述网络的参数,并且需要大量的数据样本覆盖规律可能涉及到的情景。


优秀的数学家们在过往的研究中,已经发现和总结出了一些描述规律的方法,例如,使用FFT提取数据流中的频率和能量分布特征,我们并不需要再用神经网络的方式以非常低效的方式模拟这些已知的规律,尤其是在资源受限的嵌入式硬件环境当中。一种较好的实践,是利用已知的、高效的特征提取方法作为机器学习框架(AI模型)的前端,取代用于模拟其中规律的初级网络结构,然后再结合更小巧的机器学习方法,例如SVM,或者小规模的NN网络做更高层次的抽象,从而设计出小巧高效的模型。



总结观点:

  • 使用深度学习表示规律效率低。

  • 在机器学习中使用深度网络替代已知的数学公式是愚蠢的。

  • 将已有数学公式表示的特征提取方法和小规模深度学习结合,是资源受限的嵌入式AI应用的一种有效实践。


如下原文是我在瑞萨的一位专职于AI技术开发的同事Stuart Feffer(Reality AI的创始人之一)发表的一篇博客,我翻译了其中大部分内容,以展开阐述在对数据样本做预处理的过程中使用合适的特征变换对深度学习的意义。(您可复制下方链接至浏览器,或扫描二维码查看)

英文原文链接

https://www.renesas.com/en/blogs/ffts-and-stupid-deep-learning-tricks


深度学习(Deep Learning)几乎已经主导了机器学习领域——它可以利用简单叠加多层神经网络来发现底层数据中隐藏的规律,并且取得了巨大成功。


例如,当使用深度学习来识别一张猫的图片时,深度网络的最低层会学习识别边缘、明暗梯度等视觉特征。然后,更高层次的网络会学习将这些特征组合成的各种模式,再更高层次的网络会学习这些模式组合形成的标志性的形态,而更高层次的网络则会学习进一步将这些形态组合起来以识别出猫。



在那些数据中隐藏的规律过于复杂、无法通过其他方式被发现的情况下,深度学习有着巨大的优势。只要有足够的时间和数据,深度学习几乎可以学习到任何合理的变换规律。深度学习能够破解出世界上所有的特征。然而,这总是个好主意吗?在受限(嵌入式)环境中,它可能是不适合的。


相比于其他传统数值方法,深度学习的收敛速度慢得离谱。几个世纪以来,杰出的数学家们付出了巨大努力,为大量的问题想出了最优解决方案,比如:从已知分布进行统计推断、对许多重要类型函数的近似、线性代数中的信息分析,以及像快速傅里叶变换(FFT)这样的频域分析方法。实际上,深度学习方法是试图用统一的结构和方法,以解决不同的新问题——它们或许能得到接近真实的结果,但却要以极高的低效率为代价。


举个例子,在嵌入式应用中有一个常见的问题:描述和监测一台旋转设备的工作状况。在这一领域的经典工程学中,一个典型方法是使用傅里叶变换——振动和旋转具有天然的属性特征,即是频率,另外,监测功率峰值和频谱形状也能揭示出大量信息。有些峰值是在预期内会出现的,而有些则是不好的(意味着设备可能存在问题)。


此时,假设我们有一个二分类问题,使用FFT能够巧妙地区分两个类别:正常和故障。但是,当我们不知道FFT能取得很好效果的时候,我们没有运行FFT并将其得到的特征用作模型输入,而是直接构建了一个深度学习模型,并让它去学习这两个类别——实际上是希望在深度网络的较低层中模拟出这种傅里叶变换。


快速傅里叶变换是一种由人类精心设计的出色算法,用于实现所谓的离散傅里叶变换(DFT)。但离散傅里叶变换本质上是一种线性矩阵运算,所以将DFT映射到神经网络(神经网络就是在进行输入向量和权重矩阵的乘法计算)中是相当简单的。它看起来会像是一层全连接的节点集合,(理想情况下)权重接近离散傅里叶变换矩阵,并且使用线性激活函数。然后,这个单一的特征层可以连接到更高层,以便基于傅里叶峰值做出决策。



但是,我们来考虑一下这里的各个方面:

  • 为了得到这种简单的表示形式,我们实际上不得不为这一层设计特殊的线性激活函数,而在大多数的深度网络是使用非线性的激活函数。这就意味着常规构建的深度网络已经有些偏离了目标。

  • 为了使这个网络收敛到接近实际的离散傅里叶变换,需要一大组组织良好的示例数据,这些数据要涵盖整个频率空间。来自实际振动或旋转设备的真实数据可能无法提供这种多样性,从而无法训练出一个描述完备的网络。

  • 即使是这种离散傅里叶变换的“最佳情况”网络表示,也需要N^2次乘法运算。而快速傅里叶变换(FFT)的优势就在于它只需要N log2(N)次运算。为什么我们要故意让在嵌入式芯片上执行的更大的运算量呢?


快速傅里叶变换只是众多特征空间运算的例子之一,当这些运算通过神经网络来学习时,会陷入不必要的困境。对于我们所描述的嵌入式应用中“关键频率峰值”的问题,甚至还可以有更有效的数学表示方法表示其中的规律,但如果使用深度学习网络表示这个规律,若没有巨大的计算资源,实际上不可能对其进行建模。


还有一些甚至更简单的变换,神经网络处理起来也很困难。像平方或开平方根这样基本的运算,都需要借助隐藏层网络以及数量极不相称的大量节点才能精确求解。诸如,标准差或均方根,这样明显的工程度量指标,若要使用神经网络来学习和计算它们,效率也极其低下。


所以,尤其是对于嵌入式和资源受限的应用场景,使用特征空间是一种更好的方法。


借助深度学习从头开始学习数学特征是可行的。但对于某些问题而言,这可能并非良策,而对于那些每个时钟周期和每字节内存都十分关键的受限或嵌入式应用来说,这无疑是一场必输的博弈。如果存在更直接的方法,那么使用深度学习来进行特征发现就是对资源的极大浪费。对于这些应用来说,更好的做法,是使用那些已知的、或者能够被证明可以区分目标类别的可靠特征。


Reality AI基于自动化的智能特征提取。我们采用机器学习作为AI算法框架,探索种类繁多且已被充分理解的数学和工程领域的特征空间,并应用诸如稀疏编码之类的机制,从而比直接使用深度学习更快地收敛到相关特征,并更高效地表达这些特征。



这有两个优点:

  • 由此得出的特征计算在计算效率上很高,尤其适合资源受限的嵌入式环境。

  • 从基础物理和时频特性方面来看,计算结果是可以解释的,无需借助任何由网络所表示的“黑箱”操作。


利用以这种方式发现的特征空间,再进行机器学习,仍然能够发挥机器学习在做出复杂决策方面的优势。如此,还可以部署更简单的算法,比如支持向量机(SVM)、决策树或规模较小的神经网络,与深度学习相比,能大幅节省资源。


近年来,深度学习已被用于实现一些非凡的成就。但它并非是解决所有问题的万能钥匙。套用罗伯特・海因莱因(Robert Heinlein,20世纪最有影响力的科幻作家之一)的话来说,“对于某些问题而言,使用深度学习有点像是试图教猪唱歌。这既浪费你的时间,又会惹恼那头猪。”


需要技术支持?

如您在使用瑞萨MCU/MPU产品中有任何问题,可识别下方二维码或复制网址到浏览器中打开,进入瑞萨技术论坛寻找答案或获取在线技术支持。

https://community-ja.renesas.com/zh/forums-groups/mcu-mpu/



1

END

1


推荐阅读

让AI发生 | 一站式嵌入式AI开发平台:Reality AI Tools


视频介绍 | 使用AI思维定义嵌入式系统

扩展中高端视觉AI应用 | RZ V2N新产品介绍——高能效、先进AI技术


评论 (0)
  • 三、芯片的制造1、制造核心流程 (1)晶圆制备:以高纯度硅为基底,通过拉晶、切片、抛光制成晶圆。 (2)光刻:光刻、离子注入、薄膜沉积、化学机械抛光。 (3)刻蚀与沉积:使用干法刻蚀(等离子体)精准切割图形,避免侧壁损伤。 (4)掺杂:注入离子形成PN结特性,实现晶体管开关功能。2、材料与工艺创新 (1)新材料应用: 高迁移率材料(FinFET中的应变硅、GaN在射频芯片中的应用); 新型封装技术(3D IC、TSV硅通孔)提升集成度。 (2)工艺创新: 制程从7nm到3nm,设计架构由F
    碧海长空 2025-04-15 11:33 10浏览
  • 在当今汽车电子化和智能化快速发展的时代,车规级电子元器件的质量直接关系到汽车安全性能。三星作为全球领先的电子元器件制造商,其车规电容备受青睐。然而,选择一个靠谱的三星车规电容代理商至关重要。本文以行业领军企业北京贞光科技有限公司为例,深入剖析如何选择优质代理商。选择靠谱代理商的关键标准1. 授权资质与行业地位选择三星车规电容代理商首先要验证其授权资质及行业地位。北京贞光科技作为中国电子元器件行业的领军者,长期走在行业前沿,拥有完备的授权资质。公司专注于市场分销和整体布局,在电子元器件领域建立了卓
    贞光科技 2025-04-14 16:18 119浏览
  • 你知道精益管理中的“看板”真正的意思吗?在很多人眼中,它不过是车间墙上的一块卡片、一张单子,甚至只是个用来控制物料的工具。但如果你读过大野耐一的《丰田生产方式》,你就会发现,看板的意义远不止于此。它其实是丰田精益思想的核心之一,是让工厂动起来的“神经系统”。这篇文章,我们就带你一起从这本书出发,重新认识“看板”的深层含义。一、使“看板”和台车结合使用  所谓“看板”就是指纸卡片。“看板”的重要作用之一,就是连接生产现场上道工序和下道工序的信息工具。  “看板”是“准时化”生产的重要手段,它总是要
    优思学院 2025-04-14 15:02 105浏览
  • 一、芯片的发展历程总结:1、晶体管的诞生(1)电子管时代 20世纪40年代,电子管体积庞大、功耗高、可靠性差,无法满足计算机小型化需求。(2)晶体管时代 1947年,贝尔实验室的肖克利、巴丁和布拉顿发明点接触晶体管,实现电子信号放大与开关功能,标志着固态电子时代的开端。 1956年,肖克利发明晶体管。(3)硅基晶体管时代 早期晶体管采用锗材料,但硅更耐高温、成本低,成为主流材料。2、集成电路的诞生与发展 1958年,德州仪器工程师基尔比用锗材料制成世界上第一块含多个晶体管的集成电路,同年仙童半导
    碧海长空 2025-04-15 09:30 60浏览
  • 二、芯片的设计1、芯片设计的基本流程 (1)需求定义:明确芯片功能(如处理器、存储、通信)、性能指标(速度、功耗、面积)及目标应用场景(消费电子、汽车、工业)。 (2)架构设计:确定芯片整体框架,包括核心模块(如CPU、GPU、存储单元)的协同方式和数据流路径。 (3)逻辑设计:通过硬件描述语言(如Verilog、VHDL)将架构转化为电路逻辑,生成RTL(寄存器传输级)代码。 (4)物理设计:将逻辑代码映射到物理布局,涉及布局布线、时序优化、功耗分析等,需借助EDA工具(如Cadence、Sy
    碧海长空 2025-04-15 11:30 11浏览
  • 展会名称:2025成都国际工业博览会(简称:成都工博会)展会日期:4月23 -25日展会地址:西部国际博览城展位号:15H-E010科士威传动将展示智能制造较新技术及全套解决方案。 2025年4月23-25日,中国西部国际博览城将迎来一场工业领域的年度盛会——2025成都国际工业博览会。这场以“创链新工业,共碳新未来”为主题的展会上,来自全球的600+ 家参展企业将齐聚一堂,共同展示智能制造产业链中的关键产品及解决方案,助力制造业向数字化、网络化、智能化转型。科士威传动将受邀参展。&n
    科士威传动 2025-04-14 17:55 51浏览
  • 一、磁场发生设备‌电磁铁‌:由铁芯和线圈组成,通过调节电流大小可产生3T以下的磁场,广泛应用于工业及实验室场景(如电磁起重机)。‌亥姆霍兹线圈‌:由一对平行共轴线圈组成,可在线圈间产生均匀磁场(几高斯至几百高斯),适用于物理实验中的磁场效应研究。‌螺线管‌:通过螺旋线圈产生长圆柱形均匀磁场,电流与磁场呈线性关系,常用于磁性材料研究及电子束聚焦。‌超导磁体‌:采用超导材料线圈,在低温下可产生3-20T的强磁场,用于核磁共振研究等高精度科研领域。‌多极电磁铁‌:支持四极、六极、八极等多极磁场,适用于
    锦正茂科技 2025-04-14 13:29 60浏览
  •   无人装备作战协同仿真系统软件:科技的关键支撑   无人装备作战协同仿真系统软件,作为一款综合性仿真平台,主要用于模拟无人机、无人车、无人艇等无人装备在复杂作战环境中的协同作战能力、任务规划、指挥控制以及性能评估。该系统通过搭建虚拟战场环境,支持多种无人装备协同作战仿真,为作战指挥、装备研发、战术训练和作战效能评估,提供科学依据。   应用案例   系统软件供应可以来这里,这个首肌开始是幺伍扒,中间是幺幺叁叁,最后一个是泗柒泗泗,按照数字顺序组合就可以找到。   核心功能   虚拟战
    华盛恒辉l58ll334744 2025-04-14 17:24 60浏览
  • 一、智能语音播报技术演进与市场需求随着人工智能技术的快速发展,TTS(Text-to-Speech)技术在商业场景中的应用呈现爆发式增长。在零售领域,智能收款机的语音播报功能已成为提升服务效率和用户体验的关键模块。WT3000T8作为新一代高性能语音合成芯片,凭借其优异的处理能力和灵活的功能配置,正在为收款机智能化升级提供核心技术支持。二、WT3000T8芯片技术特性解析硬件架构优势采用32位高性能处理器(主频240MHz),支持实时语音合成与多任务处理QFN32封装(4x4mm)实现小型化设计
    广州唯创电子 2025-04-15 08:53 65浏览
  • 时源芯微 专业EMC解决方案提供商  为EMC创造可能(适用于高频时钟电路,提升EMC性能与信号稳定性)一、设计目标抑制电源噪声:阻断高频干扰(如DC-DC开关噪声)传入晶振电源。降低时钟抖动:确保晶振输出信号纯净,减少相位噪声。通过EMC测试:减少晶振谐波辐射(如30MHz~1GHz频段)。二、滤波电路架构典型拓扑:电源输入 → 磁珠(FB) → 大电容(C1) + 高频电容(C2) → 晶振VDD1. 磁珠(Ferrite Bead)选型阻抗特性:在目标频段(如100MHz~1GH
    时源芯微 2025-04-14 14:53 76浏览
  •   高空 SAR 目标智能成像系统软件:多领域应用的前沿利器   高空 SAR(合成孔径雷达)目标智能成像系统软件,专门针对卫星、无人机等高空平台搭载的 SAR传感器数据,融合人工智能与图像处理技术,打造出的高效目标检测、识别及成像系统。此软件借助智能算法,显著提升 SAR图像分辨率、目标特征提取能力以及实时处理效率,为军事侦察、灾害监测、资源勘探等领域,提供关键技术支撑。   应用案例系统软件供应可以来这里,这个首肌开始是幺伍扒,中间是幺幺叁叁,最后一个是泗柒泗泗,按照数字顺序组合
    华盛恒辉l58ll334744 2025-04-14 16:09 139浏览
我要评论
0
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦