广告

车载音频不容小觑,会听话的车才叫智能汽车

2016-09-05 11:00:00 Junko Yoshida 阅读:
在先进驾驶辅助系统(ADAS)中,结合视觉处理器的CMOS图像传感器已在协助汽车辨识与分类方面发挥关键作用。至于其“听觉”呢?
广告

麦克风也能扮演像摄影机般重要的角色,为自动驾驶车增添更多“智能”功能吗?

DSP Concepts首席执行官与创办人Paul Beckmann表示,在汽车和驾驶人发现救护车接近以前,就已经听到它的警报声响起了。那么为什么汽车产业不会对音频感兴趣?

系统OEM厂商(不只是汽车制造商)目前正处于“使用更多麦克风以便为人工智能(AI)产生另一种重要传感器数据——音频”的关键时刻,Beckmann解释。

正如他所默认的,音频正“从单纯的在娱乐系统中播放,朝向在情境架构中实现输入、触发与分析。”

由麦克风所拾取的智能,也可能用于日常生活的各种系统中,从汽车、数字虚拟助理到便携设备等。“视觉与听觉应该并驾齐驱,”DSP Concepts业务与营销执行总裁Willard Tu表示。“狗吠声、婴儿哭闹、玻璃碎裂、汽车喇叭、警报声与枪声等等......音频有助于让系统更有效地掌握环境‘和情境’。”
20160905 Audio NT31P1
图1:音频“输入”算法发展蓝图 (来源:DSP Concepts)

如今,有两个重要的发展趋势推动电子产业突然在音频领域迅速发展。

一是拥有多颗麦克风的智能手机普及;其次则是数字虚拟助理的流行,如Amazon Echo与Google Home。根据SAR Insight & Consulting总监与首席分析师Peter Cooney的观察,“一般消费设备中整合虚拟数字助理的应用越来越多,带动感知与采用语音作为自然的用户接口,应用于许多日常任务中。”

但是,麦克风能多快超越作为一种自然用户接口的角色,开始变成真正的‘智能传感器’?看来业界还得等待一些进展。

为了迎接挑战,音频需要可以拾取更佳音质的麦克风、善于后处于音频的处理器、预处理音频的有效算法、易于使用的音频处理工具、相当于绘图用Open GL的音频标准,以及能以最小功耗维持永不断线的麦克风。

总之,如同Cooney所指出的,市场需要“始终保持监听的技术、语音增强算法以及麦克风。”

在ARM处理器上实现音频处理

音频处理以往是播放系统(如TV、DVD和Hi-Fi音响系统中的均衡器)才需要的专业领域。

而今在智能手机和其他家用设备的麦克风普及带动下,音频处理任务已经扩展到几乎无处不在。专用音频DSP也并不是系统中处理音频的唯一芯片了。

随着越来越多的音频开始在ARM处理器上执行,Beckmann指出,更多的OEM“热切地将麦克风视为”AI的输入传感器。DSP Concepts正处于观察这一市场过渡的最佳位置。

Beckmann看好市场成长的态势,特别是因为该公司一款称为Audio Weaver在过去一年来的成果。如同Beckmann描述的,这是“唯一一款可跨平台作业的绘图音频设计架构。”

业界分析家认为,DSP Concepts正占据音频市场上的独特位置。TECHnalysis Research总裁兼首席分析师Bob O'Donnell认为:“我并未看到DSP Concepts或其Audio Weave工具面对哪几家竞争对手。许多公司都针对音乐与录音等目的进行专业的音频剪辑与音频处理,但这毕竟是不同的领域。”

库尼表示同意。“我不知道任何竞争产品音频织女的。”他补充说,“DSP概念有其他的产品也是如此,如声音增强算法(噪音抑制,回声取消,波束赋形),基准和参考设计。”

Cooney也同意这一看法。“我还不知道Audio Weaver有任何竞对手。”他补充说,“DSP Concepts也有其他的产品,例如声音增强算法(噪声抑制、回音消除、波木成形等)、基准与参考设计。”
20160905 Audio NT31P2
图2:全球麦克风与音频处理器市场 (来源:SAR Insights & Consulting)

DSP Concepts并未设计或销售DSP。然而,竞争对手一般都是其他的DSP业者。Audio Weaver的竞争产品来自德州仪器(TI)或Cirrus Logic等DSP供应商自行打造的音频工具。其差异之处在于那些内部开发的工具仅用于DSP供应商自家的芯片。而采用像Audio Weaver这样的独立平台工具,Tu强调,“OEM不必被限制于一种特定的DSP。”

Cooney说,DSP Concepts藉由与Cadence/Tensilica等许多公司合作,主要的业务在于为其客户提供音频设计解决方案。

除了Audio Weaver工具,DSP Concepts也授权一些可形成麦克风输入的音频算法,包括波束成形、回声消除、噪声消除与远音场(far-field sound)等算法。Beckmann指出,在此业界缺乏深谙音频处理的工程人才之际,市场亟需易于使用的音频预处理算法,以便能从不需要的环境噪声中区隔出声音来。

音频:长期受冷落的领域

然而,目前使用音频进行声学事件检测(和分析)仍然是一种相对较新的应用。
O’Donnell指出,“理论上,可能会有更多专用音频处理器在做AI,但坦白说,音频就像是长期受到视频的冷落一样,而且时至今日也是如此。”

他补充说,声音的另一项重大挑战是“语言与意义”。他说,“一张树的图片以任何语言来说是树,但要了解字、词以及最重要的意义与意图,就具有语言与文化的独特性了。这使得语音识别与自然语言的处理变得十分困难。”

Beckmann坦承,音频缺乏标准,也造成了差距。

以OpenGL来看,它是一种针对图形渲染的跨语言、跨平台API。对于想要编写程序代码的视频游戏设计人员来说,这种API十分重要。像Nvidia等GPU供应商在使用这种API后就能优化其硬件。

音频世界则可以使用硬件抽象层来实现跨平台的硬件加速渲染,类似于OpenGL所扮演的角色一样。如果缺乏标准,每一家音频芯片公司都必须优化自家硬件以及自给自足。缺乏标准推迟了扩展跨平台的音频应用所需的创新脚步。

实现永不断电的续航力

Amazon Echo或Google Home等流行的数字虚拟助理下一步要实现的就是“长时倾听”(always-listening)的能力。Amazon正透过其‘tap-then-speak’的语音启动机制加速这方面的进展。但该设备还不能称得上是‘always listening’。
20160905 Audio NT31P3
图3:全球语音接口与长时倾听技术市场 (来源:SAR Insights & Consulting)

具有永不断线/长时倾听能力的设备一旦走出家门,将开始面临各种挑战。到了户外,它的音频处理能力必须从背景噪声中区隔出需要听到的声音。此外,Beckmann强调,更大的问题还在于电池寿命。

为此,他指出,“位于波士顿的新创公司Vesper开发的静态感测MEMS组件就十分关键。”Vesper专门开发压电MEMS麦克风,不久前还发布了一款新的声学传感器,可利用声能唤醒完全待机中的系统。

Vesper首席执行官Matt Crowley表示,这款新的压电MEMS麦克风VM1010可在倾听模式下汲取仅3μA电流,该组件预计在今年第四季出样。Crowley并承诺,VM1010的新版本将会配备“鉴频”(frequency discrimination)功能。这表示系统设计者可因应枪声、玻璃粉碎或人声等特定的噪声特性程序设计MEMS麦克风。

汽车内部

回过头来看看汽车内部的音频应用。语音为汽车内部提供了自然的人机接口(HMI)。

为了提高驾驶人使用免持听筒的语音质量,一线业者与汽车OEM严重地依赖音频处理技术。Beckmann说,“配备多声道(从8-32声道)扬声器的汽车,带来了十分复杂的音频系统。”

不仅如此,随着电动车的出现,汽车产业开始使用假引擎噪音——或“电子声音”。从BMW到福斯(Volkswagen)等越来越多的汽车制造商开始玩各种共鸣放大器技巧。事实上,不只是电动车,当今更省油的引擎声音更安静,也较不那么有力了。汽车制造商担心所有的平静可能会让潜在买家却步。

对于汽车产业的许多人来说,音频是熟悉的领域。汽车制造商们知道,音频可以为其提供差异化。车内的声学传感器不仅可以听到外面发生的事情,未来,车子自己的引擎也能够针对诊断应用侦测任何异常情况。

编译:Susan Hong

本文授权编译自EE Times,版权所有,谢绝转载

EETC wechat barcode


关注最前沿的电子设计资讯,请关注“电子工程专辑微信公众号”。

本文为EET电子工程专辑 原创文章,禁止转载。请尊重知识产权,违者本司保留追究责任的权利。
Junko Yoshida
ASPENCORE全球联席总编辑,首席国际特派记者。曾任把口记者(beat reporter)和EE Times主编的Junko Yoshida现在把更多时间用来报道全球电子行业,尤其关注中国。 她的关注重点一直是新兴技术和商业模式,新一代消费电子产品往往诞生于此。 她现在正在增加对中国半导体制造商的报道,撰写关于晶圆厂和无晶圆厂制造商的规划。 此外,她还为EE Times的Designlines栏目提供汽车、物联网和无线/网络服务相关内容。 自1990年以来,她一直在为EE Times提供内容。
  • 安森美65纳米Treo平台,给模拟混合信号技术带来了什么? Treo是一个统一的、模块化的、可裁剪的平台,可以根据用户的不同需求、功能和应用,快速的提供本地智能化和计算功能,实现灵活配置,并显著提高终端应用的性能和精度。
  • 诺基亚宣布将以23亿美元收购英飞朗,扩大光网络业务版图 收购完成后,诺基亚和英飞朗将通过整合双方的技术和市场资源来提高其在光网络领域的地位,尤其是在北美市场。而诺基亚将利用英飞朗的技术优势来提升其在光网络领域的竞争力,并进一步巩固其在全球市场的地位。预计,此次收购将使诺基亚光网络业务的规模增加75%。
  • 日本爱德万测试收购两家荷兰公司,夯实高端测试能力 这次收购不仅扩展了爱德万测试在全球半导体测试市场的业务范围,也可能增强其在高端测试技术领域的竞争力。通过整合Salland Engineering和Applicos的技术和服务,爱德万测试能够为客户提供更加全面和高效的解决方案,从而进一步巩固其市场地位。
  • 利用逻辑门实现数字振荡器设计 逻辑门振荡器是利用逻辑门产生周期性信号的电子部件。方案相对容易实现,并且可以主要用来生成方波。此外,所用组件的成本效益有助于使其成为一种实用且有效的解决方案。这些类型的振荡器通常非常稳健和可靠,并且主要功能几乎不会受到严重影响。缺点是无法直接生成复杂波形,所幸依赖模拟电路或微控制器可以实现。
  • ADI上调价格:涨价潮蔓延至模拟芯片 经过一个大周期性调整之后,业界似乎有了一个共识:2024年半导体市场将复苏。其中,存储芯片涨价态势最为明显,过去2个月内闪存价格上涨超过6-7成。而继存储芯片涨价,模拟芯片也开始涨价了。
  • Qorvo出售中国制造业务,立讯精密接盘北京及山东厂 Qorvo与博通、思佳讯并称为美国射频三巨头,主要设计、开发及生产“射频”集成电路产品,包括5G基站以及智能手机和其他小工具中的蜂窝和Wi-Fi连接的射频芯片。Qorvo是全球功率放大器和滤波器的主要供应商,在中国具有北京和德州两大高科技制造中心,主要支持Qorvo的集成先进蜂窝产品。
  • “一碰交互,共触未来”ITMA峰会盛大 目前,智能终端NFC功能的使用频率越来越高,面对新场景新需求,ITMA多家成员单位一起联合推动iTAP(智能无感接近式协议)标准化项目,预计25年上半年发布1.0标准,通过功能测试、兼容性测试,确保新技术产业应用。
  • 中科院微电子所在忆阻神经-模糊硬 中科院微电子所集成电路制造技术重点实验室刘明院士团队提出了一种基于记忆交叉阵列的符号知识表示解决方案,首次实验演示并验证了忆阻神经-模糊硬件系统在无监督、有监督和迁移学习任务中的应用……
  • 直角照明轻触开关为复杂电子应用提 C&K Switches EITS系列直角照明轻触开关提供表面贴装 PIP 端子和标准通孔配置,为电信、数据中心和专业音频/视频设备等广泛应用提供创新的多功能解决方案。
  • 投身国产浪潮向上而行,英韧科技再获 投身国产浪潮向上而行,英韧科技再获“中国芯”认可
广告
热门推荐
广告
广告
广告
EE直播间
在线研讨会
广告
广告
广告
向右滑动:上一篇 向左滑动:下一篇 我知道了