嵌入式神经网络赋予机器视觉、听觉和分析能力-电子工程专辑

 随着专用的处理器和软件的崛起，为开发具备人工智能的嵌入式系统敞开了大门…

人工智能(AI)潜在的应用与日俱增。不同的神经网络(NN)架构能力经过测试、调整和改进，解决了不同的问题，也开发出以AI优化数据分析的各种方法。当今大部份的AI应用，例如Google翻译(Google Translate)和亚马逊(Amazon) Alexa语音识别和视觉识别系统，都利用了云端的力量。

藉由依赖常时连网(always-on)的因特网联机、高带宽链路和网络服务，物联网(IoT)产品和智能手机应用也可以整合AI功能。到目前为止，大部份的注意力都集中在基于视觉的人工智能上，部份原因在于它易于出现在新闻报导和视频中，另外一部份的原因则是它更类似于人类的活动。
20180326-CEVA-1
声音和视觉神经网络（来源：CEVA)

在影像识别中，针对一个2D影像进行分析——每次处理一组像素，透过神经网络的连续层识别更大的特征点。一开始检测到的边缘是具有高对比度差异的部份。以人脸为例，最早识别的部位是在眼睛、鼻子和嘴巴等特征外围。随着检测过程深入神经网络，将会检测到整个脸部的特征。

而在最后阶段，结合这些特征及其位置信息，就能在可用的数据库中识别到具有最匹配的一张特定人脸。
20180326-CEVA-2
神经网络的特征提取（来源：CEVA)

为了匹配经由相机拍摄或撷取的物体，希望能透过神经网络在其数据库中找到匹配机率最高的人脸。其巧妙之处在于撷取物体时并不需要与数据库中的照片拍摄角度或场景完全相同，也不必处于相同的光线条件下。

AI这么快就流行起来，在很大程度上是因为开放的软件工具(也称为架构)，使得建构和训练神经网络实现目标应用变得容易起来，即使是使用各种不同的编程语言。两个常见的通用架构是TensorFlow和Caffe。对于已知的识别目标，可以脱机定义和训练神经网络。一旦训练完成，神经网络就可以很容易地部署到嵌入式平台上。这是一种很聪明的划分方式，能够藉由开发PC或云端的力量来训练神经网络，而功耗敏感的嵌入式处理器只需为了识别目的而使用训练数据。

这种类似人类的人/物识别能力与流行的应用密切相关，例如工业机器人和自动驾驶车。然而，人工智能在音频领域同样具有吸引力和强大的能力。它采用和影像特征分析同样的方式，可以将音频分解成特征点而馈入神经网络。其中一种方法是使用梅尔频率倒谱系数(MFCC)将音频分解成有用的特性。一开始，音频样本被分解成短时间的讯框，例如20ms，然后再对信号进行傅利叶转换(Fourier transforms)，使用重迭三角窗将音频频谱的功率映像到非线性尺度上。
20180326-CEVA-3
声音神经网络分解图（来源：CEVA)

透过这些提取的特征，神经网络可以用来确定音频样本和音频样本数据库中词汇或者语音的相似度。就像影像识别一样，神经网络为特定词汇在数据库中提取了可能的匹配。对于那些想要复制Google和亚马逊的‘OK Google’或‘Alexa’语音触发(VT)功能的业者来说，KITT.AI透过Snowboy提供了一个解决方案。触发关键词可以上传到他们的平台进行分析，导出一个档案后再整合进嵌入式平台上的Snowboy应用程序，这样语音触发(VT)的关键词在脱机情况下也可以被检测到。音频识别并不局限于语言识别。TensorFlow提供了一个iOS上的示例，可以区分男性和女性的声音。

另一个替代应用是检测我们居住的城市和住宅周围动物和其他声音。这已经由安装在英国伦敦伊丽莎白女王奥林匹克公园(Queen Elizabeth Olympic Park)的深度学习蝙蝠监控系统验证过了。它提供了将视觉和听觉识别神经网络整合于一个平台的可能性。例如透过音频识别别特定的声音，可以用来触发安全系统进行录像。

有很多基于云端的AI应用是不实际的，一方面存在数据隐私的问题，另一方面由于数据连接性差或带宽不够造成服务不能持续。另外，实时性能也是一个值得关注的问题。例如工业制造系统需要实时响应，以便实时操作生产线，如果连接云端服务的延迟就太长了。

因此，将AI功能移动到“边缘”(edge)越来越受到关注。也就是说，在使用中的装置上发挥人工智能的力量。很多IP供货商都提供了解决方案，如CEVA的CEVA-X2和NeuPro IP核心和配套软件，都很容易和现有的神经网络架构进行整合。这为开发具备人工智能的嵌入式系统提供了可能性，同时提供了低功耗处理器的灵活性。以一个语音识别系统为例，可以利用整合在芯片上的功耗优化人工智能，以识别一个语音触发关键词和语音命令(VC)的最小化组合。更复杂的语音命令和功能，可以在应用从低功耗的语音触发状态下唤醒之后，由基于云端的AI完成。

最后，卷积神经网络(CNN)也可以用来提高文本到语音(TTS)系统的质量。一直以来，TTS用于将同一个配音员的许多高质量录音片段，整合成连续的声音。虽然所输出的结果是人类可以理解的，但由于输出结果存在奇怪的语调和音调，仍然感觉像是机器人的声音。如果试图表现出不同的情绪则需要一组全新的录音。Google的WaveNet改善了当前的情况，透过CNN以每秒16,000个样本产生TTS波形。与之前的声音样本相比，其输出结果是无缝连接的，明显表现出更自然、更高质量的声音。

EETC wechat barcode

关注最前沿的电子设计资讯，请关注“电子工程专辑微信公众号”。

阅读全文，请先

本文为EET电子工程专辑原创文章，禁止转载。请尊重知识产权，违者本司保留追究责任的权利。

人工智能传感/MEMS 技术文章物联网接口/总线/驱动

返回列表

上一篇： Particle Mesh平台选用Nordic的nRF52840低功耗蓝牙SoC 下一篇： 华为高端存储获广东科技创新大会唯一特等奖

英伟达推出AI超级电脑Jetson Orin Nano Super，价格仅249美元新款开发板售价仅为249美元，而上一代40 TOPS开发板售价为499美元，价格仅为上一代的一半。这使得Jetson Orin Nano Super成为“世界上最经济实惠的生成式AI计算机”，特别适合商业AI开发者、爱好者和学生使用。
【ICCAD2024】AI时代，先进数字芯片设计下的国产EDA新路径面对AI时代带来的差异化趋势、软件应用及开发时间长、软硬件协同难、高复杂度高成本等挑战，国产EDA仍需不断探索和创新。
AWS计划追加100亿美元投资，在美国俄亥俄州扩建数据中心近年来，AWS还积极投资于人工智能（AI）、机器学习（ML）、大数据分析和边缘计算等前沿技术，以保持其在这些领域的竞争优势。
【ICCAD2024】EDA新势力：芯行纪以AI重塑数字实现新未来通过机器学习技术，EDA工具可以获取更精确的模型来预测设计中存在的问题，如布线拥塞、信号干扰、热效应等，从而为用户提供更准确快速的指导，避免后期返工。
美国计划推出“守门人”新规：简化AI芯片出口审批的同时，管制AI芯片出口这一新规则可能会引起美国在世界各地的合作伙伴和盟友的重大担忧，以及一些国家的不满，担心美国会充当单方面仲裁者，决定谁可以获得对AI至关重要的先进芯片。
美国最高法院驳回英伟达上诉请求，被控诉涉嫌误导投资者股东诉讼指控英伟达的首席执行官黄仁勋隐藏了公司记录性收入增长主要由其旗舰产品GeForce GPU的挖矿销售驱动，而非游戏销售，导致投资者对公司的盈利来源和风险敞口产生错误认知。
“一碰交互，共触未来”ITMA峰会盛大目前，智能终端NFC功能的使用频率越来越高，面对新场景新需求，ITMA多家成员单位一起联合推动iTAP（智能无感接近式协议）标准化项目，预计25年上半年发布1.0标准，通过功能测试、兼容性测试，确保新技术产业应用。
中科院微电子所在忆阻神经-模糊硬中科院微电子所集成电路制造技术重点实验室刘明院士团队提出了一种基于记忆交叉阵列的符号知识表示解决方案，首次实验演示并验证了忆阻神经-模糊硬件系统在无监督、有监督和迁移学习任务中的应用……
直角照明轻触开关为复杂电子应用提 C&K Switches EITS系列直角照明轻触开关提供表面贴装 PIP 端子和标准通孔配置，为电信、数据中心和专业音频/视频设备等广泛应用提供创新的多功能解决方案。
投身国产浪潮向上而行，英韧科技再获投身国产浪潮向上而行，英韧科技再获“中国芯”认可

18亿元！2大储能项目新动态近期，多个储能电站项目上新。■ 乐山电力：募资2亿建200MWh储能电站12月17日晚，乐山电力（600644.SH）公告，以简易程序向特定对象发行A股股票申请已获上交所受理，募集资金总额为2亿元。发
94岁巴菲特公布后事安排！1500亿美元遗产，只留0.5%给子女？投资界传奇人物沃伦·巴菲特，一位94岁的亿万富翁，最近公开了他的遗嘱。其中透露了一个惊人的决定：他计划将自己99.5%的巨额财富捐赠给慈善机构，而只将0.5%留给自己的子女。这引起了大众对于巴菲特家庭
跟着撒贝宁走进维信诺，探寻“非凡中国屏”诞生背后的科技传奇之旅万物互联的时代浪潮中，以OLED为代表的新型显示技术，已成为人机交互、智能联结的重要端口。维信诺作为中国OLED赛道的先行者和引领者，凭借自主创新，实现了我国OLED技术的自立自强，成为中国新型显示产
LGDisplay引入AI处理OLED质量异常效率提升90%，每年节约超2000亿韩元来源：IT之家12 月 18 日消息，LG Display 韩国当地时间今日宣布，已将自行开发的“AI 生产系统”投入到 OLED 生产线的日常运行之中，该系统可提升 LG Display 的 OLE
AI日报丨超级AI独角兽来了！拿下100亿美元融资，估值升至620亿美元 “ 洞悉AI，未来触手可及。”整理 | 美股研究社在这个快速变化的时代，人工智能技术正以前所未有的速度发展，带来了广泛的机会。《AI日报》致力于挖掘和分析最新的AI概念股公司和市场趋势，为您提供深度的
撒贝宁走进维信诺，探寻“非凡中国屏”诞生背后的科技传奇之旅万物互联的时代浪潮中，以OLED为代表的新型显示技术，已成为人机交互、智能联结的重要端口。维信诺作为中国OLED赛道的先行者和引领者，凭借自主创新，实现了我国OLED技术的自立自强，成为中国新型显示产
柔宇显示资产降价拍卖阿里资产显示，随着深圳柔宇显示技术有限公司（下称：“柔宇显示”）旗下资产一拍以流拍告终，二拍将于12月24日开拍，起拍价为9.8亿元。拍卖标的包括位于深圳市龙岗区的12套不动产和一批设备类资产，其中不
高科视像、新视通等持续扩大COB产能近期，高科视像、新视通、江苏善行智能科技等企业持续扩充COB产能。插播：加入LED显示行业群，请加VX：hangjia188■ 高科视像：MLED新型显示面板生产项目（二期）招标12月18日，山西高科
面板大厂引入AI，每年节省10亿！ LG Display 12月18日表示，为加强OLED制造竞争力，自主开发并引进了“AI（人工智能）生产体系”。“AI生产体系”是AI实时收集并分析OLED工艺制造数据的系统。LG Display表
巨头疲软行业内卷，极越为谁而“亡”？在上海嘉定叶城路1688号的极越办公楼里，最显眼的位置上，写着一句话：“中国智能汽车史上，必将拥有每个极越人的名字。”本以为这句话是公司的企业愿景，未曾想这原来是命运的嘲弄。毕竟，极越用一种极其荒唐的

热门评论
最新评论

换一换

嵌入式神经网络赋予机器视觉、听觉和分析能力

杂志声明