语音是复杂人机交互的强大基础,可穿戴声学传感器可以通过连接到喉咙捕捉声带振动。然而,现有的语音识别可穿戴传感器通常采用固体材料(如压电材料、聚合物薄膜、金属和二维材料),其依赖声压导致的材料变形或振动。但由于这些材料的皮肤适形性差、灵敏度有限、检测范围窄以及易受运动伪影干扰,它们的功能和应用受到限制。
近期,加州大学洛杉矶分校陈俊教授团队报告了一种用于语音识别的液体声学传感器。该方法基于悬浮在载液中的钕铁硼磁性纳米粒子的三维定向和分支磁网络结构,其行为类似于永磁体。该传感器可以区分小压力(0.9Pa),具有高信噪比(69.1dB),并提供自滤波功能,可以消除低频生物力学运动伪影(小于30Hz)。作者使用液体声学传感器与机器学习算法一起创建可穿戴语音识别系统,该系统在嘈杂的环境中提供 99% 的识别准确率。相关成果以“A self-filtering liquid acoustic sensor for voice recognition”为题发表在《Nature Electronics》期刊上。第一作者为Xun Zhao, Yihao Zhou为共同一作。
陈俊教授
传统声传感器的声阻抗(约40 MRayl)比生物组织高十倍,无法与皮肤表面良好贴合(图1a)。尽管超薄弹性体制成的柔性传感器有所改进(图1b),但仍存在机械失配和气隙,影响了声学性能。为解决这些问题,本研究开发了液体声学传感器,采用液体材料设计以减少阻抗失配并增强声波传输(图1c)。液体声学传感器使用低硬度的PFM材料,能够更好地与组织形成共形界面。根据不同液体的流变特性(图1d),作者选用膨胀流体PFM,具有对高频声音信号的灵敏响应,并可减少低频生物力学伪影。PFM通过3D ORM网络结构保持铁磁性与稳定性,纳米颗粒均匀分散(图1e-f),表面经SiO2涂层增强生物相容性,最终形成稳定的3D网络(图2a)。
图1:自过滤液体声传感器
通过二甘醇(DEG)修饰PFM,提升其对高速频率信号的响应(图2b)。在不同磁场强度下观察3D ORM结构的形成过程:0.1 T下未见明显取向(图2c),0.2 T时开始形成簇(图2d),1.5 T时簇互连并形成明确的3D网络(图2f)。随着磁场增加,颗粒在X方向的取向显著增强(图2g-j),X/Y比率从1.00增至1.75,网络的连接节点数也从1.37增至3.00,与蒙特卡罗模拟结果一致。即使在移除外部磁场后,PFM的3D结构依然保持磁化强度。磁滞回线显示PFM具有约0.1 T的矫顽力和12.4 A·m²/kg的剩磁(图2k),其磁通密度在1.8 T达到饱和,长期测量显示其剩磁在46天内稳定(图2l)。这些结果表明PFM具有稳定的铁磁性。
图2 :PFM的形成过程
✦
基于 PFM 的液体声传感器
✦
可穿戴声学传感器在通信中发挥重要作用,但传统的固体材料传感器由于皮肤适形性差,传感性能受限。基于PFM的液体声传感器通过更好的贴合性和灵敏度提升了解决了这一问题(图3a)。PFM被注入导电线圈,并在一侧涂上PDMS形成薄膜(图3b, 3c),使其能与皮肤紧密贴合(图3d)。当受到声压时,传感器将喉部细微振动转化为磁场波动,进而通过磁感应生成电信号。实验表明,液体声学传感器具有极高的检测精度(0.01 Hz)和宽频响应范围(0.4至10 kHz),能够检测微小声压变化(如0.9 Pa)并生成相应的电输出(图3g, 3h)。
图3:液体声传感器的制造
✦
皮肤舒适度和自过滤能力
✦
基于PFM的液体声学传感器与皮肤的紧密贴合性优于传统固体材料传感器(图3i),克服了固体材料在弯曲皮肤表面易产生间隙和声阻抗失配的问题(图3j, 3k)。液体材料具有高流动性,能够快速适应皮肤轮廓,优化了传感性能和舒适度。PFM的流变特性可根据频率调整,通过减轻低频运动伪影提取干净的声压信号(图4a)。其剪切稀化行为和可调节的粘弹性特性(图4b, 4c, 4d)使其能够准确捕捉并转换声波,特别是在更高频率下实现高保真电信号输出。这一特性使液体声学传感器在复杂声学环境中具备更强的信号处理能力。
✦
运动伪影缓解
✦
运动伪影会导致可穿戴传感器的信号失真,影响测量数据的准确性,并增加信号处理的复杂性和设备功耗。相比之下,基于液体的声学传感器能更有效地减轻运动伪影。在测试中,液体传感器实现了69.1 dB的高信噪比,远高于固体传感器的18.4 dB(图4e)。液体传感器能有效去除低频机械信号干扰(图4f),并在90 dB的噪声环境下保持稳定性能(图4g),而固体传感器则易受噪声和振动影响(图4h, 4i)。液体传感器在信噪比、声阻抗、一致性、检测精度等多个参数上表现优异,并且对电磁干扰和温度变化不敏感。
图4:液体声传感器的表征
✦
可穿戴语音识别系统
✦
液体声学传感器在可穿戴语音识别系统中的应用展示了其在人机交互中的潜力,尤其在智能轮椅控制方面(图5a)。该系统结合液体声学传感器和定制印刷电路板,用于采集、处理声音信号并通过卷积神经网络(CNN)识别语音命令(图5b, 5c)。通过训练,系统能够准确识别“走”、“停止”、“左”、“右”、“后”等语音命令,识别率高达99%(图5e, 5f),并成功实现了对智能轮椅的实时控制(图5h)。未来通过优化信号处理和算法,有望进一步缩短响应时间和提高识别精度。
图5:基于液声传感器的可穿戴语音识别系统
✦
小结
✦
本文报道了一种基于自过滤液体声学传感器的语音识别方法,该传感器利用PFM保持磁化,具备可调节的流变特性,能够根据人声动态调整频率响应范围。液体声学传感器显示出69.1 dB的信噪比(SNR)和自滤波功能,有效减轻运动伪影。在机器学习算法的帮助下,构建的可穿戴语音识别系统识别准确率达99%,并成功用于控制轮椅。相比固体声学传感器和水凝胶,PFM具有更好的皮肤适应性和较低的声阻抗,潜在应用包括声音健康监测和替代通信方法等。