指纹识别自20世纪初开始在警用领域获得应用,到2013年后借助在智能手机等消费电子市场的快速爆发走入大众视野,用了近100年;而人脸识别只用了五六年就造就了商汤、依图、 旷视、云从等“独角兽”企业,并在安防领域广泛应用。这个令人惊叹的发展速度背后,是人工智能产业凭借深度学习算法上取得的突破、并在计算机视觉领域应用的结果。同样应用深度学习算法技术的计算机听觉与生物识别的结合——声纹识别,或将成为继人脸识别之后的下一个爆发的增长点。
声纹识别技术厂商是如何看待这项技术未来的发展呢?声扬科技联合创始人、CEO,生物识别从业十五年的李亚桐近日分享了他的洞见与思考。
身份认证需求升级推动AI技术与生物识别加速融合
近20年来,随着互联网和移动互联网的快速发展,人们生活、工作、交流的方式都发生了翻天覆地的变化,越来越多原先“需要本人到现场办理”的事项,都可以通过打电话、发短信、上网或在手机APP上操作来远程自助办理,随之而来的是在没有本人到场时仍能准确认证身份的安全问题——身份证件、数字密码等存在的造假盗用成本低、容易丢失遗忘等弊端,引发了人们对更高安全性、便捷性的身份认证方式的需求,而指纹、人脸、声纹、虹膜、DNA等生物识别方式凭借“不会丢、不会忘、不易仿冒”的特性成为了身份认证的主要方式。而人工智能技术的发展应用在生物识别领域,大大提升了效率、准确率和体验。“时不时会有人问我,人脸识别、指纹识别已经很好用了,你们做声纹识别如何与这些技术竞争?”
声扬科技李亚桐演讲时说到,“各项生物识别技术都存在自身的局限性、应用场景的无限丰富性这些问题,比如很多老人的指纹已经磨损难以识别、打电话的过程中难以采集人脸和指纹等。因此,没有任何一种生物识别技术可以满足所有场景的需要,多种生物识别结合使用也成为满足安全性、易用性和成本控制等方面的综合需要。所以,声纹识别与人脸识别或者指纹识别不是对立、竞争的关系,而是融合、互补的关系,实现1+1 >2的效果。”
“锦上添花”和“非它不可”如何选择
不同于指纹、虹膜、人脸等静态的生理特征,声纹蕴含于千变万化的动态语音之中。即便同一个人两次读相同的内容,也不一定能发出完全相同的声音。正是声纹这种“蕴不变于万变中”的特性,使得声纹特征伪造起来更为困难,因此认证强度更高、更安全。同时,人类语音中还蕴含着说话内容、语义、语气、语速、发音等丰富的信息,可与声纹识别结合进一步加强安全性。
关注到声纹作为动态行为特征在应用中带来的安全性和易用性,李亚桐在完整经历了指纹、掌纹、静脉、虹膜、人脸识别的应用发展后,选择将声纹识别技术直接应用到对安全等级要求最高的领域。
“创业之初,声扬科技就掌握声纹识别、语音识别、前端语音信号处理等多项技术,在寻找落地应用场景时,我们把能为客户创造独特价值放在第一位。我们认为好的AI技术应该是可靠的工具而非玩具,用语音识别身份在一些场景下非常有必要。比如帮助银行、保险、社保等金融机构识别欺诈行为、降低贷款坏账率、识别骗保行为、减少养老金流失等,又比如在公安系统内利用语音作为电子物证,缩小嫌疑人侦查范围、加快案件侦破速度、甚至对潜在的犯罪行为进行监测预警等,这才是我们技术创新者最期待看到的。”
经得起高安全应用场景考验的声纹识别,才能玩得转下一个十年的语音交互
人工智能技术的发展在近60年来经历三起三落,资本市场目前对于人工智能企业也从狂热趋向于冷静务实,技术壁垒与落地应用、平衡当前与未来巨大的技术研发投入和营收回报,是投资人同等看重的。李亚桐也在演讲中分享了声扬科技的未来战略,他认为在未来两到三年,只有经过金融业、公安部门对安全、性能、技术、服务要求最苛刻的检验和打磨,再面向更多通过金融和公安领域认识到声纹识别技术价值的行业去应用时,才会带来符合用户对智能语音交互预期的体验,从而推动整个智能语音产业持续发展。
李亚桐表示,声扬科技会在智能语音发展的浪潮中,坚持技术创新并将新技术投入社会最需要、哪怕是最难的领域, 让AI真正发挥价值。