根据咨询机构Yole Développement的预测,受益于消费电子市场可预见的爆发式增长,3D成像与传感的市场规模将从2016年的13亿美元增长至2022年的90亿美元,其中用于消费电子的3D成像与传感市场将从2016年的2000万美元增长至2022年的60.58亿美元,复合年均增长率(CAGR)达到158%。
2011-2022年全球3D成像与传感市场收入预测
而比“惊人的”预测数据更有说服力的则是产品走入消费市场。
2017年,苹果公司在iPhone X中去掉Touch ID功能,转而采用3D传感技术的Face ID。今年,Android阵营厂商也陆续开始探索类似的3D传感技术。
现阶段,3D摄像头演进出了三条主流技术路线:结构光(Structured light)、飞行时间(TOF, Time of Flight)和双目视觉技术(Stereo Vision)。技术上虽各有千秋,但终极目的是相同的——构建一个3D的生态帝国。
帝国之前——选什么枪炮,又从哪找弹药?
不同于过去的“百万像素战争”,大多数智能手机从业者可能会在3D传感技术这条新战线上打得更辛苦。
首先是方案的选择问题。从技术角度来看,3D结构光成像原理,是结构光投射特定的光信息到物体表面后,由摄像头采集反射信息,然后再根据物体造成的光信号的变化来计算物体的位置和深度等信息,进而复原整个三维空间。该技术优势在于技术成熟,深度图像分辨率比较高,但缺点是容易受光照影响。
而TOF成像原理,是发射一束经过相位调制的红外激光到被测物体,当红外激光被反射回摄像头时,会因为光飞行时间的延迟,导致相位与发射时的相位有微小的变化,通过计算相位的变化,就可以计算出被测物体到摄像头之间的距离。TOF方案基本不需要使用光学棱镜,抗干扰性能好,视角更宽,不足是深度图像分辨率较低。而且目前TOF方案实现AR功能的体验并不太理想,业内人士分析认为这与设备不想占用太多CPU资源从而降低运行速度有关。
双目视距则利用双摄像头系统,通过两个摄像头的夹角形成3D图像,原理类似人眼。目前双摄像头基本已经和快充一样成为手机的标配,所以这一方案理论上成本应该最低。但整体系统的复杂性、高功耗、不理想的暗光环境表现,以及低精度却会带来较大的局限性。联想曾在支持Project Tango的Phab2 ProAR手机上尝试类似的方案,但体验并不乐观。
双目视觉、结构光和飞行时间技术对比
其次,更重要的是3D传感系统极高的复杂性以及关键组件的生产问题。因为3D摄像头包含众多需要运作一致的零组件,还需要充分的供应链管理。有人甚至将3D摄像头形容为“一堆子装置(sub-devices)”。
与传统摄像头产业链相比,3D摄像头产业链新增加了“红外光源+光学组件+红外传感器”等部分,这使得垂直腔表面发射激光器(Vertical-Cavity Surface-Emitting Laser, VCSEL)、准直镜头(WLO)、光学衍射光栅(DOE)等一跃成为核心器件。虽然3D摄像头早期一般使用LED作为红外光源,但LED不具有谐振器,导致光束更加发散,而VCSEL在精确度、耦合性、小型化、低功耗、可靠性方面都更有优势,所以现在常见的3D摄像头系统均采用VCSEL作为红外光源。
有分析机构认为3D传感技术在Android阵营的大规模普及可能要到2019年,主要因为现阶段3D感测模组的生产良率偏低:第一,高效率VCSEL组件生产不易,目前平均光电转换效率仅约30%;第二,结构光技术的必要组件DOE以及红外光镜头的CIS,都需要极高的技术底蕴;第三,3D感测模组生产过程需考虑热胀冷缩的问题,提高模组组装的困难度。
帝国第一步——设计一台支持3D结构光的手机
Find X 3D结构光相机的组成部分
6月19日OPPO Find X横空出世,和双轨潜望结构一样引人注目的则是集成在这一结构中的OPPO FaceKey 3D结构光系统。5月初,OPPO就曾宣布过将在6个月内将结构光商用在OPPO手机中。而很多人没想到的是,OPPO竟会在一个月内就发布产品。这让OPPO收获了很多“第一”的名号。但更重要的是,OPPO让整个产业的大规模量产时间表提前了一年。
OPPO FaceKey 3D结构光
要在半年时间内完成包括结构光发射端、接收端和结构光解码芯片在内的整个硬件方案的选型、预研、试产和验证工作,同时快速攻破结构光模组选型、基线选型、结构光深度图出图、深度图校准、深度相机与RGB相机校准、人脸安全方案验证等重重难关,OPPO面临的硬件开发难度可想而知。
与硬件方案同样难啃的,是软件方案的设计。安全人脸框架与方案的核心,包括硬件出图、图像校正、网络算法验证等,必须全部运行在安全的TEE环境中,以解决人脸信息、支付环境和算法的安全性。但在OPPO之前,3D人脸算法在国内无成熟经验可借鉴。在算法自研刚启动时,OPPO算法团队在3D数据、服务器环境、算法方案上也均是零经验。
然而在随后短短的3个月内,OPPO算法团队与硬件团队使用结构光硬件完成了10万人次的3D人脸数据采集,人脸数据分布覆盖全球,并在此期间完成了500TFlops大型训练服务器的搭建。同时,为了达到百万分之一的误识精度,OPPO还与AI算法公司旷视科技Face++与商汤深入探讨了3D人脸识别算法,并在人脸检测、人脸识别与活体检测算法上形成了一套属于自己的算法方案。
OPPO 3D人脸支付所包含的安全技术
最终,通过4轮硬件方案迭代和10轮人脸算法迭代训练,OPPO成功完成了现今顶级体验的结构光方案。对比数据显示,在单张深度图3D渲染、3D渲染精度、抗强光以及50cm-70cm距离识别方面,OPPO Find X方案较iPhone X更为成熟;在20-50cm距离识别、功耗、分辨率、帧速、体积等方面也毫不逊色。而国内首例3D人脸识别算法的面世,也标志着OPPO在技术研发领域已经是业界一个不可忽略的力量。
除了OPPO,安卓生态其他厂商也在摸索3D成像的技术未来。与Find X同期,小米在小米8发布会上推出了小米8探索版,在异形屏的刘海区集成了3D结构光系统。而就Find X发布后不久,vivo也在上海MWC期间演示了其ToF方案。
帝国发展——3D数据要安全到可以用于支付
生物识别技术最重要的因素就是安全,不应该有“之一”。这也是3D结构光人脸认证相较于2D人脸识别最大的优势之一。虽然后者在过去一年也成为手机发布会上必提及的功能,但以算法为主要实现方式的2D人脸识别虽然实现了非常极速的解锁速度,依然面临非常严重的安全问题。一些评测机构甚至发现仅仅通过用普通打印机打印一张A4的照片就可以解锁很多2D人脸识别的手机。
比设备被解锁更严重的,则是个人信息的安全性。这一方面指私人的敏感数据,包括个人身份信息、以及像银行卡号、密码等财务信息;另一方面则是是生物信息自身,比如说指纹数据以及面部信息。银行卡丢失还可以补办改密码,但是指纹或者面部信息一辈子也无法更改,外泄之后的风险是永久的。因此,这也是支付机构如果要支持人脸或者指纹认证的时候,必须要经过非常严苛认证过程的原因。
从另一个角度来说,支付机构对3D结构光技术认可,一方面是可以对这一技术的安全性背书,另一方面则是肯定这一技术未来能否普及的重要因素。所以技术OPPO在Find X上支持支付宝刷脸支付的意义就更加重大了。
Find X和支付宝的合作,是OPPO与蚂蚁金服达成的战略合作伙伴关系的一部分。除了支付以外,双方还将成立联合创新实验室,探索硬件和软件底层技术的深度整合,比如支持OPPO手机上支付宝的性能优化和高频支付场景的一步直达。
OPPO产品经理李胜在Find X发布会介绍与蚂蚁金服的合作
在联合创新实验室的推动下,Find X就可以做到一上市即可支持支付宝的人脸支付。以结构光为硬件基础,并结合OPPO基于深度学习的人脸智能识别自研算法,3D人脸支付可以精确比对用户录入与识别的信息,将误识别率控制在百万分之一的支付精度,远高于当前约为五万分之一的指纹识别误识别率。用户可以期待在未来更多OPPO手机中利用这一技术,放心地用面部替代指纹、密码或PIN码作为移动支付应用的主要验证方式。
帝国初现——打通端到端的3D数据流通
3D结构光技术获得的3D数据如果只用于解锁和支付,那么对丰富数据的利用显然不够充分,手机厂商也不会只停留在这一层面。所以,虽然iPhone X和Find X 3D结构光目前给用户带来了安全又新奇的体验,但更有意义的则是两家厂商对整个3D数据潜在布局的想像。
就在Find X发布前不久的5月,OPPO宣布成功实现全球首个采用3D结构光技术的5G视频通话演示。通过OPPO手机的结构光系统采集3D数据,利用高通的5G新空口终端原型机,最终在远端接收显示器实现三维人像画面的还原。
3D视频通话
在6月的WWDC 2018上,苹果除了重点介绍ARkit 2,更隆重推出“USDZ”的3D文件格式。有开发者评论称“这一成就堪比秦始皇统一六国之后实施的‘车同轨’,这种3D文件格式让跨App间的3D数据传输成为可能。”就在这一发布会上,苹果演示了同一组3D图像可以在Safari、新闻以及是相机中跨应用呈现。从去年第一次在iPhone X上搭载3D成像系统,到今年发力3D图像的呈现场景,不难看到苹果在这一技术领域的布局。
作为计算机视觉的一个分支,3D成像功能提供了底层的技术能力,并由此让设备具备了增强现实(AR)、3D人脸这些新功能,而这些新功能又赋能了经典的SoLoMo业务以及新兴的短视频、直播、游戏等等业务,给予用户新鲜的体验。除了之前重点谈及的安全支付外,三维重建、AR和游戏将极有可能成为未来通过3D结构光技术实现的突破性应用场景。
以AR应用为例,在3D AR游戏中,利用结构光对周围的环境进行精确3D建模,将模型实时导入游戏中,实现虚拟游戏与现实三维世界的紧密融合,实现逼真的三维效果。或是通过精确的结构光双摄相机拍摄的三维信息,可以实现精确的AR帖子与微表情效果。Gartner预测到2021年,40%的智能手机将会配备可用于AR的3D摄像头,分析师Jon Erensen甚至表示,“这种功能对AR来讲非常重要,我认为那是一种你绝不想落在后面的事情。”
OPPO Find X发布会介绍3D结构光应用场景
所以我们看到苹果和OPPO都在布局AR。前者在近两年的WWDC都把ARkit作为重点之一来介绍;后者也联合商汤科技、浙江大学CAD&CG国家重点实验室携手打造出名为ARunit的开发平面,能够支持即时定位与地图构建(SLAM)、多平面恢复、非平面表面上放置虚拟物体、平面标志识别、光照估计、地图保存与状态设置、遮挡处理等特性,可以帮助开发者打造出新一代的全新AR应用。自3月19日发布,已吸引了包括京东、王者荣耀13家合作伙伴产品的入驻,并预计在2018年全年为8000万台OPPO手机提供AR支持。
OPPO ARunit
在OPPO看来,移动互联网正在模糊现实世界和数字世界的边界。虚拟图像+虚拟图像、虚拟图像+实景图像、实景图像+实景图像的两两结合将带来泛在现实(Ubiquitous Reality, UR)的全新一代用户体验。这远不是我们今天所看到的VR、AR这么简单,而未来真正进一步推动沉浸式用户体验的,将是3D内容和“即将来临”的5G。因此,通过主动式结构光感知目标物体位置和深度信息,对整个三维空间实现高分辨率、高精确度的复原,然后通过低延迟5G网络对3D视频进行实时传输,将成为下一代移动用户体验泛在现实的关键。
在5G网络下实现3D视频通话
通俗点说,OPPO是打算利用5G网络高速率的特性,来支撑3D视频信号的大数据传输,从而给用户提供全新的通话体验。这显然不再仅仅只是二维层面的视频通话,而是在一个立体空间展示下得到的视频通话体验。虽然现在因为显示技术的局限性,并不能直接呈现3D数据,但可以看到的是未来在3D数据呈现端的技术发展到位之后,我们就可以体验科幻作品中的“全息投影”一样的数字生活。
总结
3D影像技术确实已经成为诸多手机厂商的技术发展重点方向,其重要性在未来可能不亚于5G和AI。但因为技术应用规模化的问题,目前除了解锁和支付,还没有出现全新的杀手级应用。
厂商们普遍认为成本高、良率等问题会导致3D传感摄像头在2018年只适用于售价高于3000元的旗舰机型中,但从2019年初开始,会与指纹、双摄等技术一样,成为2000元以上智能手机的标配,而到2020年,覆盖面将进一步扩大,千元机型配备3D传感摄像头将不是一件令人惊讶的事情。
3D传感摄像头市场渗透预估
而随着3D技术在智能手机这一最大消费电子市场中的广泛应用,应用场景必然会更加丰富。届时,OPPO和苹果的3D帝国又将表现出怎样的活力?
本文为《电子工程专辑》原创,版权所有,谢绝转载
关注最前沿的电子设计资讯,请关注“电子工程专辑微信公众号”。