2021年4月9日,由CIOE中国光博会、麦姆斯咨询、中新嘉善主办,上海传感信息科技有限公司、华强电子、深圳光学光电子行业协会协办的『“人脸识别·金融支付”创新峰会』在上海卓美亚喜玛拉雅酒店隆重举办!云从科技模组产品线负责人钮峰博士发表了题为《多场景下的人脸身份认证》的精彩演讲,深入分析了人脸身份认证的主要技术、多样化场景、面临的困难和挑战,并介绍了云从科技的人脸身份认证技术方案。
云从科技模组产品线负责人钮峰博士发表精彩演讲
钮峰博士首先为在场观众简单介绍了云从科技的公司发展历程。云从科技于2015年正式成立,最初主要专注于人脸识别算法;2016年开始,云从科技参与了多个人工智能国家标准和行业标准的制定,由其开发的中国首个机场智能系统在银川机场全面上线;2017年开始,承接了多个国家人工智能基础平台的建设。随后几年内,云从科技不再局限于人脸识别的技术,在视觉、语音、大数据甚至风控处理等领域都展开了大量工作。2020年,云从科技发布了人机协同操作系统,旨在借助人工智能技术赋能各行各业。目前,云从科技的人机协同操作系统已经在智慧金融、智慧治理、智慧出行、智慧商业等场景落地。钮峰博士随后分享了云从科技对人脸支付落地智慧金融场景的需求、挑战,以及云从科技的相关技术方案。接下来,就让我们跟着钮峰博士的演讲思路,获取更多干货吧!
人脸身份认证主要技术
目前人脸身份认证过程由三个环节完成,依次是人脸信息获取、活体判断、人脸比对。
人脸信息获取:一般通过单目摄像头(彩色摄像头或黑白摄像头)、双目摄像头(两个可见光摄像头,或一个可见光摄像头加一个红外摄像头,或双红外摄像头)、3D结构光摄像头或者3D ToF摄像头等硬件获取人脸相关信息。
活体判断:基于硬件输入信息的不同,活体判断算法大体可以分为四类。第一类是静默活体,主要是针对单目摄像头的人脸信息输入,检测速度快。第二类是配合式动作活体,针对单目摄像头的人脸信息输入,需要用户配合完成简单动作,相比静默活体安全性能更高,但会影响用户体验。第三类是红外活体,根据一个可见光(RGB)摄像头和一个红外(IR)摄像头的输入信息进行活体判断。第四类则是3D活体,增加了深度信息,可有效应对平面攻击手段。
人脸比对:根据活体判断信息的不同,分为纯2D比对、纯3D比对、“2D+3D”结合。2D比对效果不好的时候,3D可以作为补充,理论上来说,“2D+3D”结合更好。只是目前为止,3D比对由于数据量不足,其优越性没有完全体现出来,但从整体趋势来看,未来3D比对会有更多的场景。
上述硬件与相应的算法组合成人脸身份认证方案。虽然各个性能存在差异,但是各有优缺点,没有哪种更为优秀的定论,用户应该根据不同应用场景选择更合适的方案。
人脸身份认证的场景多样,挑战依然严峻
产生上述这么多不同人脸身份认证技术方案的原因,主要是由丰富的场景需求所造成。简单来讲:设备、空间和距离是三大要素。
人脸身份认证的多样化场景:设备、空间和距离
不同的应用场景决定了所使用的设备不同,不同的设备如通用设备(如最常见的智能手机)或专用设备(如ATM取款机)决定了所获取可用的人脸信息会有所差异,从而后续的活体以及识别算法也会相应的不同。而空间的多样性(比如室内或者室外)导致会面临多样的光线环境,这会对信息采集的硬件有不同的要求,那目前3D结构光模组举例,大多数3D结构光模组在室内效果不错,但是在室外很难获得好的3D数据,要想解决室外场景,可能需要选择有更强发射功率的投射器和更好的重建算法。另外人脸身份认证的不同工作距离,对采集传感器的要求也是不同的,传感器分辨率和镜头参数等都要针对性的选择。已归纳了三类主要因素,还有一些其他多种因素,这些因素造成了人脸身份认证场景的多样化,而针对多样化的场景,目前是无法用一种方案(传感器、算法)解决所有问题的。
除此之外,人脸身份认证也面临着诸多困难。首先,光照条件变化带来的影响是很大挑战。由于后端算法取决于前端视觉传感器的输入信息,摄像头尤其是RGB摄像头对光线非常敏感,在逆光、侧光环境中,如何能获取到很好质量的图像?如果图像质量不好,比如模糊,会对活体识别造成很大的困扰。其次,层出不穷的攻击手段,从最初的二维静态图像,到现在的三维面具、头模等,攻击方式一直在演进,这对算法的能力的迭代,以及迭代的速度提出了越来越高的要求。第三,良好的用户体验是一款产品能否大规模落地的基础。用户的要求是检测速度要快,活体通过率高,安全性好,这个在处理平台计算能力不强的情况下是很大的挑战。第四个挑战来自数据安全性,目前个人影像数据的采集、储存、使用等环节不是每家企业都能处理好,国家相应监管机制也在逐步建立中,只有营造非常安全的环境,才能使人脸支付产业健康地发展下去。
云从科技的人脸身份认证技术方案
演讲最后一部分,钮峰博士介绍了云从科技的四类人脸身份认证技术方案。
云从科技的四种人脸身份认证技术方案
第一类是静默活体方案,其优势在于无需特殊设备(普通摄像头即可),也不需要用户做任何动作进行配合,通过抓取RGB图像,在系统后端进行判断,因此用户体验友好。适用于对安全性要求不高的场景,如手机上的APP。
如果针对单RGB采集数据,需要更高的安全性,则可采用动作活体方案。这也是目前大部分手机APP采用的远程的认证方式。该方案通过主要由两部分组成。使用时,系统前端需要用户配合完成动作,如转头、点头、张嘴、眨眼等,来进行初步的活体验证和最佳人脸图选取,初步活体通过后,数据会被送入后端的活体检测引擎来进一步的活体判别,从而有效预防各类攻击。这个方案相比静默活体技术安全性高很多,但是牺牲了一些用户体验。
第三类是红外双目身份认证方案,这个方案人脸信息从可见光光谱拓展到红外光谱。很多攻击使用的道具,包括头模,在红外光波段的表现是不一样的,分析攻击道具和人脸皮肤在近红外图像中的纹理等特性的差异则可以判断是否是活体,并进一步分析提取人脸特征,进行人脸比对、识别身份。这种方案检测速度快、需要的硬件成本低,在很多场景如自助机具、柜面设备、人证核验设备、刷脸支付设备、轨交闸机等都得到了广泛的应用。
第四类是3D(结构光/ToF)身份认证方案。钮峰博士展示了云从科技研发的两款3D结构光模组,一款是普通的3D结构光模组,一款是算法前置3D结构光模组,活体算法内嵌在模组内更安全。通常3D结构光采集模组输出三幅图:RGB图、红外图和深度图,每幅图对活体的判断在不同场景下所起的作用不同,这些会隐形地包含在算法模型里。云从科技的算法模型会针对不同的场景以及每幅图的成像质量进行算法策略的调整。因此,无论用于室内还是室外,亦或是光线较暗的夜间,场景鲁棒性都很强。这也是云从科技在算法和前端采集模组深度结合产生出更优秀性能方面实践很好的案例。