摘要:电子科技大学和格拉斯哥大学的研究人员合作开发了一种用于无声语音识别的贴片式智能传感器件,可以检测到说话时细微的喉咙振动,借助深度学习将其转化为可读的单词,这为语音控制和人机界面智能感知开辟了新的机遇。
关键词:智能人工喉咙,压阻传感器,无声语音识别,深度学习,人机界面
声带是咽部组织的褶皱,是人类发声的主要结构。在说话和唱歌等发声动作中,声带通过与空气相互作用而振动。声带病变可导致声音嘶哑甚至完全失声,造成沟通障碍。在这种情况下,人们提出了语音辅助设备来帮助患者进行语言表达。传统上,手持式电子喉需要用户在说话时将设备牢牢地按在脖子上或嘴巴里,这会在执行驾驶或吃饭等双手任务造成不便。因此,需要一种更舒适、更通用的贴片式人工喉装置来帮助患者进行交流。
最近发表在 Advanced Intelligent Systems 期刊上的最新研究中,电子科技大学张晓升教授课题组和格拉斯哥大学Rami Ghannam教授课题组开展联合研究,提出了一种新型的用于无声语音识别的贴片式智能传感器(智能人工喉)。该装置基于一种新型压阻式传感器,该传感器可以感知微弱压力变化并做出响应,由两个涂有银纳米线和还原氧化石墨烯薄膜的 PDMS 层制备得到。为了提高设备的灵敏度,研究人员展示了一种简单高效的制造微结构的方法。该方法使用喷枪喷涂聚苯乙烯微球在两层PDMS之间,与没有微结构的传感器相比,在微弱振动激励下(0-33Pa),该器件的灵敏度提高了135倍。此外,贴片式人工喉咙装置具有高灵敏度、快速响应时间和良好的耐久性等特点。
具有无声语音识别能力的贴片式智能传感器(贴片式人工电子喉)将促进患者之间交流的便利性。智能人工喉通过将深度学习算法与高灵敏的压阻式传感器相结合,可以成功识别出说不同单词时喉咙的细微振动。虽然一些现有技术已经使用贴片式传感器进行声音检测,但这些设备只是检测到喉咙的运动,而没有进一步探索将人工智能用于语音识别的可行。研究者表示,开发的设备能够检测说话过程中的喉咙振动,并将电信号转化为可读的文字,这进一步证明它可以成为促进患者交流的有价值的工具。