近年来,利用高级驾驶辅助系统(ADAS)等向行人和搭乘人员告知车辆状态和存在已经变得非常重要,汽车制造商们正在推进语音输出系统的开发,通过音效和语音来发出警告或通知。按照罗姆半导体(上海)有限公司技术中心主管姚玲玲给出的数据,全球车内语音市场大概有50亿日元的规模。而且,不止车载领域,安防、家电、工业设备等领域对语音的需求也都在不断提高,例如家电产品的说明/使用提示、安防烟感报警等。
“分久必合,合久必分”
罗姆半导体(上海)有限公司高级工程师佘梦怡表示,响应性能对于警报声来说非常重要。以车载应用为例,随着大量创新功能的不断加入,主控MCU不得不承受越来越繁重的工作负荷。如果通过独立硬件实现语音播报,LSI方案可在命令发送的5毫秒之内响应并进行语音播报,更加稳定可靠。
另一方面,传统通过MCU实现语音的结构,不仅需要大量部件,还会给主控MCU带来高负荷,在采取措施规避风险和系统变更时的软件支持方面也需要耗费大量的工时。因此,为相关应用单独开发一颗语音合成LSI芯片,正成为新的设计趋势。
语音合成LSI是直接连接到扬声器,并仅需发送简单命令即可播放语音的IC。通常内置高音质的音频解码器、各种高性能滤波器、通信接口、存储器、放大器等语音播放所需的部件,具备发音功能、故障安全功能等。而ROHM集团旗下的蓝碧石半导体(LAPIS Semiconductor)日前推出的车载语音合成LSI“ML2253x系列”产品,正是专门用于ADAS和AVAS(车辆接近警报装置)语音输出系统的。
打造更高品质的车载声音
相比传统解决方案,ML2253x系列内置有通信接口、逻辑、存储器、放大器,可构建不依赖于主控MCU的语音输出系统,并同时减少软件设计工时。此外,该系列还在上述优势的基础上新增了“播放音异常检测功能”,该功能会将扬声器输出的模拟信号重新转换为数字信号,并将其与LSI内部的播放数据进行比较,当检测到高于设置值的异常情况时,会将错误信号反馈至主控MCU,非常有助于提高语音输出系统的品质。
与此同时,为了提高开发便利性的功能,ML2253x系列还支持出厂后的语音数据修改。也就是说,在以往利用ROM烧写器进行的板上改写功能基础上,新产品利用主控MCU经由SPI I/F将数据写入内置FLASH存储器(ML22Q53x系列)或外置FLASH存储器(ML22530系列),不仅可以在开发过程中改写语音数据,而且还可以在产品出厂后改写语音数据。使用该功能,还可以支持未来与互联网的紧密连接、逐步实现IoT的新一代汽车的需求。
采用可同时兼顾高音质和节省内存的“HQ-ADPCM”压缩方式,也是提高开发便利性的创新之一。众所周知,高音质和节省内存之间存在着矛盾权衡关系,而HQ-ADPCM压缩方式,正好兼顾并同时实现了这两个优点。以往只能采用PCM压缩方式,音效和音乐在压缩时会严重劣化,或者只能不压缩。而新产品通过采用HQ-ADPCM方式,即使将存储器容量压缩到以往压缩方式的1/5,也可以正常播放出流畅的声音。此外,还可以使用声音设备控制套件中的Speech LSI Utility,将语音数据的压缩方式转换为HQ-ADPCM。
考虑到车载使用环境,ML2253x系列支持车载要求的高温工作(105℃)和汽车电子产品可靠性标准“AEC-Q100”。此外,还搭载了以往机型中搭载的短路检测、高温异常检测、命令传输错误检测等异常检测功能,这些功能也非常有助于提高车载语音输出系统的可靠性。
在回答采用LSI专用芯片加语音合成软件会不会成为未来的趋势时,姚玲玲回应称,出于安全性的考虑,建议使用单独的语音芯片。语音合成方面,还需要看系统需要实现什么功能,例如现在可以做到4096段的语音数据,如果未来还需要更多或更复杂的比如语音识别或其他功能,可能还需要搭配其它软件。
新产品已于2020年4月起开始出售样品(样品价格1,300日元/个,不含税),预计将于2020年7月开始量产,开发套件和参考板也同步开售。