广告

车载音频不容小觑,会听话的车才叫智能汽车

2016-09-05 11:00:00 Junko Yoshida 阅读:
在先进驾驶辅助系统(ADAS)中,结合视觉处理器的CMOS图像传感器已在协助汽车辨识与分类方面发挥关键作用。至于其“听觉”呢?
广告

麦克风也能扮演像摄影机般重要的角色,为自动驾驶车增添更多“智能”功能吗?

DSP Concepts首席执行官与创办人Paul Beckmann表示,在汽车和驾驶人发现救护车接近以前,就已经听到它的警报声响起了。那么为什么汽车产业不会对音频感兴趣?

系统OEM厂商(不只是汽车制造商)目前正处于“使用更多麦克风以便为人工智能(AI)产生另一种重要传感器数据——音频”的关键时刻,Beckmann解释。

广告

正如他所默认的,音频正“从单纯的在娱乐系统中播放,朝向在情境架构中实现输入、触发与分析。”

由麦克风所拾取的智能,也可能用于日常生活的各种系统中,从汽车、数字虚拟助理到便携设备等。“视觉与听觉应该并驾齐驱,”DSP Concepts业务与营销执行总裁Willard Tu表示。“狗吠声、婴儿哭闹、玻璃碎裂、汽车喇叭、警报声与枪声等等......音频有助于让系统更有效地掌握环境‘和情境’。”
20160905 Audio NT31P1
图1:音频“输入”算法发展蓝图 (来源:DSP Concepts)

如今,有两个重要的发展趋势推动电子产业突然在音频领域迅速发展。

一是拥有多颗麦克风的智能手机普及;其次则是数字虚拟助理的流行,如Amazon Echo与Google Home。根据SAR Insight & Consulting总监与首席分析师Peter Cooney的观察,“一般消费设备中整合虚拟数字助理的应用越来越多,带动感知与采用语音作为自然的用户接口,应用于许多日常任务中。”

但是,麦克风能多快超越作为一种自然用户接口的角色,开始变成真正的‘智能传感器’?看来业界还得等待一些进展。

为了迎接挑战,音频需要可以拾取更佳音质的麦克风、善于后处于音频的处理器、预处理音频的有效算法、易于使用的音频处理工具、相当于绘图用Open GL的音频标准,以及能以最小功耗维持永不断线的麦克风。

总之,如同Cooney所指出的,市场需要“始终保持监听的技术、语音增强算法以及麦克风。”

在ARM处理器上实现音频处理

音频处理以往是播放系统(如TV、DVD和Hi-Fi音响系统中的均衡器)才需要的专业领域。

而今在智能手机和其他家用设备的麦克风普及带动下,音频处理任务已经扩展到几乎无处不在。专用音频DSP也并不是系统中处理音频的唯一芯片了。

随着越来越多的音频开始在ARM处理器上执行,Beckmann指出,更多的OEM“热切地将麦克风视为”AI的输入传感器。DSP Concepts正处于观察这一市场过渡的最佳位置。

Beckmann看好市场成长的态势,特别是因为该公司一款称为Audio Weaver在过去一年来的成果。如同Beckmann描述的,这是“唯一一款可跨平台作业的绘图音频设计架构。”

业界分析家认为,DSP Concepts正占据音频市场上的独特位置。TECHnalysis Research总裁兼首席分析师Bob O'Donnell认为:“我并未看到DSP Concepts或其Audio Weave工具面对哪几家竞争对手。许多公司都针对音乐与录音等目的进行专业的音频剪辑与音频处理,但这毕竟是不同的领域。”

库尼表示同意。“我不知道任何竞争产品音频织女的。”他补充说,“DSP概念有其他的产品也是如此,如声音增强算法(噪音抑制,回声取消,波束赋形),基准和参考设计。”

Cooney也同意这一看法。“我还不知道Audio Weaver有任何竞对手。”他补充说,“DSP Concepts也有其他的产品,例如声音增强算法(噪声抑制、回音消除、波木成形等)、基准与参考设计。”
20160905 Audio NT31P2
图2:全球麦克风与音频处理器市场 (来源:SAR Insights & Consulting)

DSP Concepts并未设计或销售DSP。然而,竞争对手一般都是其他的DSP业者。Audio Weaver的竞争产品来自德州仪器(TI)或Cirrus Logic等DSP供应商自行打造的音频工具。其差异之处在于那些内部开发的工具仅用于DSP供应商自家的芯片。而采用像Audio Weaver这样的独立平台工具,Tu强调,“OEM不必被限制于一种特定的DSP。”

Cooney说,DSP Concepts藉由与Cadence/Tensilica等许多公司合作,主要的业务在于为其客户提供音频设计解决方案。

除了Audio Weaver工具,DSP Concepts也授权一些可形成麦克风输入的音频算法,包括波束成形、回声消除、噪声消除与远音场(far-field sound)等算法。Beckmann指出,在此业界缺乏深谙音频处理的工程人才之际,市场亟需易于使用的音频预处理算法,以便能从不需要的环境噪声中区隔出声音来。

音频:长期受冷落的领域

然而,目前使用音频进行声学事件检测(和分析)仍然是一种相对较新的应用。
O’Donnell指出,“理论上,可能会有更多专用音频处理器在做AI,但坦白说,音频就像是长期受到视频的冷落一样,而且时至今日也是如此。”

他补充说,声音的另一项重大挑战是“语言与意义”。他说,“一张树的图片以任何语言来说是树,但要了解字、词以及最重要的意义与意图,就具有语言与文化的独特性了。这使得语音识别与自然语言的处理变得十分困难。”

Beckmann坦承,音频缺乏标准,也造成了差距。

以OpenGL来看,它是一种针对图形渲染的跨语言、跨平台API。对于想要编写程序代码的视频游戏设计人员来说,这种API十分重要。像Nvidia等GPU供应商在使用这种API后就能优化其硬件。

音频世界则可以使用硬件抽象层来实现跨平台的硬件加速渲染,类似于OpenGL所扮演的角色一样。如果缺乏标准,每一家音频芯片公司都必须优化自家硬件以及自给自足。缺乏标准推迟了扩展跨平台的音频应用所需的创新脚步。

实现永不断电的续航力

Amazon Echo或Google Home等流行的数字虚拟助理下一步要实现的就是“长时倾听”(always-listening)的能力。Amazon正透过其‘tap-then-speak’的语音启动机制加速这方面的进展。但该设备还不能称得上是‘always listening’。
20160905 Audio NT31P3
图3:全球语音接口与长时倾听技术市场 (来源:SAR Insights & Consulting)

具有永不断线/长时倾听能力的设备一旦走出家门,将开始面临各种挑战。到了户外,它的音频处理能力必须从背景噪声中区隔出需要听到的声音。此外,Beckmann强调,更大的问题还在于电池寿命。

为此,他指出,“位于波士顿的新创公司Vesper开发的静态感测MEMS组件就十分关键。”Vesper专门开发压电MEMS麦克风,不久前还发布了一款新的声学传感器,可利用声能唤醒完全待机中的系统。

Vesper首席执行官Matt Crowley表示,这款新的压电MEMS麦克风VM1010可在倾听模式下汲取仅3μA电流,该组件预计在今年第四季出样。Crowley并承诺,VM1010的新版本将会配备“鉴频”(frequency discrimination)功能。这表示系统设计者可因应枪声、玻璃粉碎或人声等特定的噪声特性程序设计MEMS麦克风。

汽车内部

回过头来看看汽车内部的音频应用。语音为汽车内部提供了自然的人机接口(HMI)。

为了提高驾驶人使用免持听筒的语音质量,一线业者与汽车OEM严重地依赖音频处理技术。Beckmann说,“配备多声道(从8-32声道)扬声器的汽车,带来了十分复杂的音频系统。”

不仅如此,随着电动车的出现,汽车产业开始使用假引擎噪音——或“电子声音”。从BMW到福斯(Volkswagen)等越来越多的汽车制造商开始玩各种共鸣放大器技巧。事实上,不只是电动车,当今更省油的引擎声音更安静,也较不那么有力了。汽车制造商担心所有的平静可能会让潜在买家却步。

对于汽车产业的许多人来说,音频是熟悉的领域。汽车制造商们知道,音频可以为其提供差异化。车内的声学传感器不仅可以听到外面发生的事情,未来,车子自己的引擎也能够针对诊断应用侦测任何异常情况。

编译:Susan Hong

本文授权编译自EE Times,版权所有,谢绝转载

EETC wechat barcode


关注最前沿的电子设计资讯,请关注“电子工程专辑微信公众号”。

Junko Yoshida
ASPENCORE全球联席总编辑,首席国际特派记者。曾任把口记者(beat reporter)和EE Times主编的Junko Yoshida现在把更多时间用来报道全球电子行业,尤其关注中国。 她的关注重点一直是新兴技术和商业模式,新一代消费电子产品往往诞生于此。 她现在正在增加对中国半导体制造商的报道,撰写关于晶圆厂和无晶圆厂制造商的规划。 此外,她还为EE Times的Designlines栏目提供汽车、物联网和无线/网络服务相关内容。 自1990年以来,她一直在为EE Times提供内容。
  • 去除示波器和数字化仪中的噪声和干扰 即使在最佳设计中,噪声和干扰也会悄然降低信噪比、掩盖所需信号并影响测量精度和可重复性。示波器和数字化仪等数字化仪器集成了多种功能,用于表征、测量和减少噪声对测量的影响。
  • 准备好耳塞了吗?让我们制造点噪声吧! 本文介绍了一些生成常见且有用的噪声类型的好方法,包括白色、粉色和褐色(可选)。核心组件是一个经过编程的MCU,用于生成原始白噪声,以及一个改进的滤波器,用于将白噪声转换为粉色噪声。
  • 罗姆:ESG理念下开启“Power Eco Family”创新征程 面对当下气候变化引发的自然灾害、资源枯竭、人口增长与少子高龄化等社会突出问题,罗姆不但适时提出“Electronics for the Future”愿景,还在2020年制定了新的企业经营愿景,专注于功率电子和模拟技术,助力客户实现产品“节能”和“小型化”,以解决社会课题,并实现自身可持续发展。
  • 将人工智能应用于射频设计 人类的发明,即工程系统,依赖于物理学和数学基本原理,如麦克斯韦方程、量子力学和信息论等,以实现特定目标。然而,随着工程系统复杂性和规模迅速增长,其子组件的功能可能呈现出非线性特性,这使得基于第一原理的设计方法受到限制。
  • 安森美65纳米Treo平台,给模拟混合信号技术带来了什么? Treo是一个统一的、模块化的、可裁剪的平台,可以根据用户的不同需求、功能和应用,快速的提供本地智能化和计算功能,实现灵活配置,并显著提高终端应用的性能和精度。
  • 诺基亚宣布将以23亿美元收购英飞朗,扩大光网络业务版图 收购完成后,诺基亚和英飞朗将通过整合双方的技术和市场资源来提高其在光网络领域的地位,尤其是在北美市场。而诺基亚将利用英飞朗的技术优势来提升其在光网络领域的竞争力,并进一步巩固其在全球市场的地位。预计,此次收购将使诺基亚光网络业务的规模增加75%。
  • 赤池昌二先生升任TEL集团副总裁兼 TEL宣布自2025年3月1日起,现任TEL中国区地区总部——东电电子(上海)有限公司高级执行副总经理赤池昌二正式升任为集团副总裁,同时兼任东电电子(上海)有限公司总裁和东电光电半导体设备(昆山)有限公司总裁。
  • 2025年无线连接的七大趋势 预计在2025年,以下七大关键趋势将塑造物联网的格局。
  • 4月必逛电子展!六大热门新赛道,来NEP 领域新成果领域新成果4月必逛电子展!AI、人形机器人、低空飞行、汽车、新能源、半导体六大热门新赛道,来NEPCON China 2025一展全看,速登记!
  • ASML公布2025年度股东大会议程,并提 本次股东大会将采取线上和线下相结合的混合形式召开,股东们可选择现场出席或线上参会。
广告
热门推荐
广告
广告
广告
EE直播间
在线研讨会
广告
广告
广告
向右滑动:上一篇 向左滑动:下一篇 我知道了