2020年的春节注定载入史册,新型冠状病毒在全国范围内爆发,这场灾难为国人带来巨大创伤的同时,也让全国人民感受到了万众一心、共同抗“疫”的决心与力量。疫情期间,一些主攻安防和安全的人工智能(AI)企业纷纷出招,将AI技术用于抗疫防疫。
随着人工智能对传统行业的赋能改造效果越来越显著,人们已习惯了应用人脸识别或是指纹识别技术完成支付、出行认证、考勤打卡等行为。但《电子工程专辑》曾报道,在疫情防控的特殊时期,人人戴口罩的情况下,手机人脸识别功能应用困难,分析师认为这甚至可能影响到今年iPhone的销量。
而在疫情防控大环境要求下,手指接触认证的方式因为容易交叉传播病毒而变得不安全起来,“非接触”也成了硬性标准之一。小编的公司复工后暂时取消了指纹打卡,换成了人工登记。虽然问题解决了,但麻烦程度却无形增加了。
相比之下,语音或声纹识别(Voiceprint Recognition,VPR)技术通过空气传播,不受口罩影响,不直接接触设备终端,能有效避免疫情情况下的病毒传染风险,或许是现在身份认证比较好的选择之一。
语音识别大家都不陌生,主要是以AI算法自动将人类的语音内容转换为相应的文字,但并不能够确认说话人的身份。
而声纹识别不同,它也称说话人识别,是一种通过声音判别说话人身份的技术。声纹是用电声学仪器显示的携带言语信息的声波频谱,是由波长、频率以及强度等百余种特征维度组成的生物特征,具有稳定性、可测量性、唯一性等特点。
人类语言的产生是人体语言中枢与发音器官之间一个复杂的生理物理过程,发声器官–舌、牙齿、喉头、肺、鼻腔在尺寸和形态方面每个人的差异很大,所以任何两个人的声纹图谱都有差异。每个人的语音声学特征既有相对稳定性,又有变异性,不是一成不变的。这种变异可来自生理、病理、心理、模拟、伪装,也与环境干扰有关。尽管如此,由于每个人的发音器官都不尽相同,因此在一般情况下,人们仍能区别不同的人的声音或判断是否是同一人的声音。
声纹识别又分为说话人辨识(Speaker Identification)和说话人确认(Speaker Verification)。前者用以判断某段语音是若干人中的哪一个所说的,即“ 多选一”;后者用以确认某段语音是否是指定的某人所说,即“一对一判别”。
不同的任务和应用会使用不同的声纹识别技术,如缩小刑侦范围时可能需要辨认技术,而银行交易时则需用到确认技术。在本次疫情中,人脸识别、指纹识别受限的情况下,声纹识别能够保障工作的正常开展,节省人力成本,提升各领域认证效率。
用于医疗
声纹识别最核心的功能,便是能在无接触的情况下进行身份确认,在医疗领域,这一功能可以在挂号、缴费、医保理赔、医疗器械权限、识别病人音灶等环节发挥作用。
例如,以声纹识别技术进行预约挂号,通过身份信息核对,可有效避免非法挂号行为;以声音作为身份信息实现住院、缴费等流程一体化,能保障患者个人信息和财产安全,实现跨省共诊及跨省支付;通过声纹验证,可防止医保冒用医保欺诈等情况;以声纹验证为重要的医疗器械加上权限,避免误操作及非相关人员误用;更甚者,还可以用声纹进行病人情绪及声音病灶识别,以现代化手段实现望闻问切。
360金融这次就面向全国各地所有医院、社区、乡村及相关机构免费开放“疫情通”智能机器人服务。借助ASR语音识别和智能外呼技术,“疫情通”智能机器人可以准确快速识别用户意图,并做出相应回答。据悉,经过不断测试优化,目前“疫情通”已能够实现社区普查、医院回访等。与此同时,“疫情通”也将正式应用于360金融与医联共同组建的线上7*24小时免费问诊,提供疫情咨询和居家隔离方案。
当然,在疫情期间,在医院这类患者密度高、病毒传播风险大的场所,声纹的最大效用当属有效避免接触、减少口罩摘戴、降低病毒传播。
防疫资料采集
本次防疫工作一大重点就是人员资料的搜集和排查,以便尽早发现疑似病例并隔离。常用的人员上门排查由于效率低、有传播风险已经不可取;使用APP或小程序让民众自行申报,可以高效采集相关信息,如个人身份、近期接触人群、外出情况等,并对防疫敏感词进行标记,帮助社区工作人员对高危人群进行有效的摸底、排查,但无法保证数据的真实性。
如果你在疫情中有过外出经历,那么你应该已经接到过 AI 打给你的电话。它会询问你外出的经历、往返时间地点,以及回到居住地之后的身体状况,这些数据通过 AI 外呼系统聚集到一起,成为基层防疫管控的数据基础。
声扬科技在本次疫情期间,就结合AI外呼技术推出了“闻声”远程声纹健康回访服务系统。据介绍,这个系统实现了健康状况及情绪状态的实时识别,能对异常情况自动检测并生成报告,让基层防疫工作更高效、智能和安全。
该系统通过声纹识别技核验受访者的身份,确保在多次回访中受访者身份的一致性,根据声音识别出受访者的性别、情绪、咳嗽次数等生理和心理特征,便于防疫机构掌握受访人员的健康状况,并建立健康档案。通过该系统还可以每日自动跟踪信息,定期生成统计报表,供防疫机构快速掌握第一手信息并为大数据分析提供数据支撑。推出类似疫情机器人的企业还有云知声、思必驰、小i机器人以及BATJ(百度、阿里、腾讯、京东)等。
设备控制
我们每天都要用手按无数次按钮,进出家门的指纹锁、进出小区的大门开关、进入写字楼和刷卡机的间接接触、搭乘电梯按下楼层按钮、进入办公室的指纹打卡……
这些接触的片刻看似轻描淡写,却可能给病毒入侵创造时机。如果声纹识别加入电梯智能系统,用户只需说出楼层数字,系统便可根据声纹的唯一性,自动识别用户身份,判断是否属于该楼的住户或员工,并且将用户带到指定的楼层去。
广州广日电梯工业有限公司就开发了这样一种声纹识别呼梯控制系统
写到这里小编又想到了语音转文字系统,科大讯飞这项技术虽然已经很不错,但用起来还是差那么点感觉。毕竟现在我摸完办公室的键盘,都不敢再摸脸了……
公共安全
在大安防场景下,视频监控面对戴口罩的人们或许显得力不从心,但通过声纹识别技术进行治安防控,仍能让犯罪分子“现出原形”。
声纹识别技术厂商快商通表示,在车站、机场、码头、酒店等公共安检点和关键卡口,或在通信系统、安全监测系统中嵌入快商通声纹识别技术,通过声纹生物特征与语音内容的双因子识别,可以有效对涉暴、涉恐、涉毒等重点人员进行鉴别和提示警报,通过通讯跟踪和声纹辨别技术进行预防和侦查追捕。
声纹采集建库是声纹识别在公共安全领域大规模应用的基础,声纹采集系统主要部署在公安各基层信息采集室中,用于对重点人员的声纹信息进行采集,形成继指纹、DNA库后又一个生物特征库。因此,国家对声纹采集设备的要求非常高,需满足公安局发布的《声纹数据采集终端系统参数和项目要求》,包括功能要求、技术参数要求、验收要求、技术培训要求以及质量保修期和售后服务要求。目前,公安部已公布了首批被认证的声纹采集设备制造商,包括科大讯飞、声扬科技、快商通、国音科技、远鉴科技等厂商。
远程办公
受疫情影响,国内大部分企业延期复工,导致远程办公及视频会议系统等线上服务产品需求成倍猛增。不少企业担心客服人员在家办公可能会有所怠慢,比如态度不好、用语不规范等。在此场景下,智能语音质检系统采用语音识别、声纹识别、自然语言处理等技术,一方面可在线对远程呼叫中心坐席与用户交互行为规范性进行实时智能检查,根据预定义规则,自动检测和匹配对话内容,获取客服绩效、服务质量和精准情绪检测,无需人工干预,解决呼叫中心远程办公条下的客服规范化管理,确保用户在疫情期间也能感受到优质的客户服务。
另一方面,部分企业的销售人员不能及时复工,可能错过一些客户打到公司总机的咨询电话。智能语音系统,或者叫AI电话机器人则可以基于语义理解、声纹识别、机器学习等算法等模拟真人声音与客户进行电话销售。随后自动筛选出意向客户,并向销售人员推送提醒,意向录音可直接转为crm线索进行人工远程跟进。
而声纹识别还有一个功能在于取代人工完成会议纪要,通过语音识别和声纹识别技术的结合,将会议录音通过语音识别技术识别说话内容、通过声纹识别技术标注每段话所对应的说话人,不仅解决“说了什么”,更精准到“谁说了什么”,能大大提高工作效率。
责编:Luffy Liu
本文综合自AI大数据及人工智能、亿欧网、声扬科技、快商通AI、CSDN、360金融报道
- 声纹不受影响吗?你带个防毒面具试试
- 那些娘娘腔和声优又有得忙了,,,