2018年中,旷视科技与商汤、云从、依图并列四大CV独角兽。
2019年初,旷视科技发布AI大脑:河图,大举进入AI物流行业。
旷视科技从最初的Face++人脸识别到如今的AI物流,有人说是转型,甚至说是不得已的转型,有人说是升级,从技术升级到产业升级,机器人网和国际电子商情进行了实地采访了解,让我们来细细理清其发展轨迹,也给目前真假难辨,扎堆AI的科技业一个清晰地脉络。
一、首先,我们来看看其发展历程
旷视科技从2011年成立开始,就搭建了世界最大的人脸识别云平台Face++,到2018年4月,全资收购了艾瑞斯机器人(Ares robot)。
北京艾瑞思机器人技术有限公司(Ares robot ),主要在于智能机器人、人工智能、大数据等核心技术研发,为物流仓储、智能工厂等行业客户提供产品和解决方案。
Ares robot 核心技术团队成员均毕业于清华、北航、哈工大、北理工等知名高校,在机器人、智能硬件、人工智能、机器视觉、大数据、云计算等方面具有丰富的技术积累和十年以上的相关行业工作经验,60%以上的公司员工具有硕士及以上学历。这与旷视科技大部分人才来源于清华的人才结构类似。
二、再看看其研发体系
旷视科技是中国最早用深度学习的方法展开人工智能应用研发的科技企业之一,拥有自主原创的人脸识别技术、物体检测与识别、视频智能分析与模式识别技术、嵌入式系统开发技术、云计算和大数据等核心技术。2015年旷视科技推出自研深度学习引擎 MegBrain 及深度学习平台 Brain++,实现内部深度学习的计算和数据资源管理自动化,以及算法训练流程化。在自有的深度学习引擎和基础数据架构之上,旷视研究院还持续围绕分类、检测和分割等图像识别的核心问题,以及云端、移动端、芯片等不同平台的深度学习模型实现算法创新,能够服务于平台化的产品、改善产品体验和品质。
旷视科技研究院成立于2011年,总部设在北京,由近200名全职研究员、副研究员组成,孙剑博士担任院长,同时,旷视还在西雅图、南京、成都设有分研究院和专门负责人。2017年11月5日,旷视科技宣布成立旷视科技学术委员会,并由中国科学院院士、首位图灵奖华人得主姚期智先生担任首席顾问。旷视学术委员会是旷视科技集结全球顶级专家学者和院士设立的学术研究机构,致力于深化推进旷视在“产学研用”中的理论创新。同年12月,旷视先后与西安交通大学和香港科技大学等国际一流的高等学府成立人工智能联合实验室,以通过人才集聚推动技术革新并促进旷视在深度学习研究、智能芯片、3D感知等领域的宏远发展。
(一)技术路径
(二)原创技术
1、动态人脸识别
实现视频流中人脸检测、关键点定位及人脸识别功能的毫秒级响应,使得人脸识别技术可以在实际场景中实现非配合式快速处理,可广泛应用于地产、城市管理、交通等领域。
2、在线/离线活体检测
通过云、硬件级解决方案,实现对关键点实时标注和变化的检测,完成在线上及线下场景进行实名验证过程中,对照片攻击、切换攻击、面具攻击、遮挡攻击的防御。
3、超大人像库实时检索
系统支持身份证图片、视频监控截图、社会资源录像截图片等多种图片源,针对不同图片库质量进行优化,对光照、局部遮挡、跨年龄段、非正常表情等情况进行优化,并完成千万级别库的实时检索。
4、证件识别
识别身份证、行驶本、驾驶本等各类证件上文字,并返回结构化的结果。在识别过程中,可区分复印件、屏幕翻拍件或是后期合成等。目前已被支付宝、中信银行在内等300多家金融机构使用。
5、行人检测、轨迹分析
识别图片、视频流中出现的行人位置和数量,并可以完成对行人头部、身体、四肢的实时分割与追踪。并可以对视频流中同一人员行动轨迹进行追踪与分析。广泛应用于零售、城市管理、物业等领域。
(三)早期核心技术
三、AI仓储物流系统架构
此次旷视科技发布了AI大脑:河图,主要切入仓储物流行业,那么我们来看看一个智能化AI仓储物流系统的基本架构是什么样的:
这是一个智能仓储物流系统的基本架构图,也是早期亚马逊仓储系统的架构,其基础是AI调度和各种识别系统,包括路径、物体、人脸等识别,以及避障系统。而这些识别系统的核心均是基于CV(计算机视觉)。这对于旷视科技最早的Face++技术积累不是问题。
同时,在2018年4月,旷视科技全资收购了艾瑞斯机器人,这样就补齐了机器人硬件方面的短板,实现了软硬结合全方位解决方案。
四、转型or升级
从以上各方面来看,旷视科技从CV到AI物流不是不得已的转型,也不能简单的说是升级,应该算是AI行业的进化。
因为,AI发展经历的最早阶段是视觉处理、人脸识别,然后通过一些列的落地应用,譬如城市管理、金融、零售、支付等,到了这个阶段,AI技术已经成熟度很高,就不得不需要进一步的深度挖掘,这时候,有的进入医疗,譬如依图,有的进入银行业,譬如云从,有的进入自动驾驶等领域,譬如商汤。而旷视科技选择进入250万亿的仓储物流行业(是250万亿!没错)。
未来,AI将不是简单的落地应用在我们的普通生活中,会在各大行业领域深入融合,给我们的生活带来真正的无感人工智能体验,这才是AI的进化之路。
五、实际情况答疑
那么,旷视科技的具体实际情况如何呢?
机器人网&国际电子商情在河图发布会上与旷视科技相关负责人进行了深入交流,下面是旷视对于此次战略产品发布的部分答疑。
提问:刚才听您介绍,旷视科技专注于物流行业,在这段时间也收购了一家仓储机器人的企业,那么公司在物流行业的布局和战略,现在是不是主要是应用于仓储方面?物流的其它细分领域,比如配送等等,其实都是跟AIOT相关的,贵司有没有计划?
您是说旷视科技会在5年之后连接10亿机器人吗?在这5年里,贵司在物流领域有哪些发展计划?想进入哪些细分领域?
CTO唐文斌:
我们认为这个场景确实是非常有价值,因为从业的人数很多,也很辛苦,这件事情其实是可以从效率上被提升的,帮助他们把这个场景做得更好,这是机会点所在。
回到你的问题:
第一,怎么做事情。
第二,我们会不会在其它的场景中做。
我觉得这一次战略的发布,最核心一的点其实是展现出了自己的定位:我们有硬件的能力,但我们不会去做各种类型的硬件,我认为这个不是最核心的。
每一层都要最专业的人来做,就是在你有一个更清晰的架构图上之后,每一层都应该是最专业的人,因为你只有这样才能做到最好,比如说从硬件的角度来讲,它一定要最快、最稳,成本最低,所以会有很多的优化。
对于软件的层面,算法你要优化到最好,方案必须要能符合各种各样的场景,所以这里面其实是有非常多的工作,我们核心的定位是说我们以河图为中心。我们当然会有少量的这种设备,但是我们只会做很少的设备,且把它做精。
此外,我们会开放一些底层的技术,尤其是视觉类的一些技术,我们可以给到我们的合作伙伴,来帮助大家把设备做得更好。
所以这是一个共同合作的过程。
另外,我们会不会向除了物流场景之外的其它场景方向去发展。这个要分阶段。第一个阶段不会,整个物流产业的每一个环节都蕴藏着非常大的机会,但是每一个环节其实都很难,不管是做物流配送,还是做无人驾驶的运输,我认为都是非常难的场景。
每一个环节其实都蕴含着巨大的商业价值,也都面临非常难的挑战,所以旷视一直践行技术信仰和价值务实,我认为从一个更长远的角度来讲,我们没有给自己设限,但是从更务实的角度来讲,我们不会很快去做太多的场景,因为很难把每一个场景都做得很扎实,所以我们希望是说从仓和工厂开始。
工厂其实也就是个大仓,在这样的场景里面,我们能够去做细分,能够把每一个场景的价值真正交付出来。
提问:B端跟AIOT确实是今年的大方向,为什么我们会选择物流和制造业作为切入点呢?
CTO唐文斌:
我觉得有两点:
第一,印奇说的大,是指物流是一个非常大的行业,而且这是一个关系到国计民生的一个行业,因为物流在影响着我们每一天的生活,在全球拥有250万亿的市场,即便在中国,物流产业也占整个GDP的15%左右。
第二,我们确实看到了需求,印奇今天在台上讲了一个故事,我可以再跟大家分享一下。
我们现在在跟心怡打造的天猫超市的仓库,就是大概在三年前,我跟印奇一起去的仓库,当时是冬天去的仓库,大概有2万多平,非常大,大家想象一下,暖气和空调是没有任何意义的。
你下的每一个天猫超市的订单,都有一个人帮你逛超市,他得把几个东西凑到一起打个包发给你,他们不是一单一单逛了,他们也有很多的创新,他们做了一个小车子,可以十几个订单一起逛。
每一个操作员在这里面一天要走30-40公里,那个仓当时的温度是零下10度,大家想象一下,一个人在零下的场景里面每天走一个马拉松,非常刺激。
我还带我们的首席科学家去体验过一次,他觉得这是一个特别减肥的地方,干这个事情是非常辛苦的,很多人其实也不太愿意干这个事情。
所以,我们觉得这个里面蕴含着很多的需求,这是一个痛点的问题,我们希望解决它。
彭广平:我补充一点,刚才这位朋友提的问题非常好,机会很多,但是哪些机会是现在能做的,哪些是未来5到10年能做的,这个非常重要。作为一个创业公司,我们要加速快跑,而且我们要选准方向,既有现在要做的,也有未来要做的。
刚才讲了医疗还讲了零售,其实有很多事儿,我们可能也会做一些相应的技术储备,但是不代表现在就需要去做和落地。但是为什么选仓储,刚才文斌也讲了,其实像无人驾驶现在很热,但是大家想到没,无人驾驶是涉及到很多的技术,因为要做雷达、算法各方面,大家认为什么时间才能落地?这并不是一个短期能达成的目标,这里面还涉及到法律、交通等方面一系列的问题。
但是我们选仓和工厂比较封闭的场景,除了确实有很多的痛点,更因为我们发现,我们现有的技术,或者我们储备的一些技术,可以马上帮我们的客户去创造价值,就是刚刚说的降本增效,马上可以给客户带来一些效益。