看点:三维视觉上位记:从Face ID到刷脸付,再到安防、三维建模和工业质检。
不到一年时间,阿里、腾讯,这两个国内首屈一指的超级经济体全部入局了。
这边支付宝的“蜻蜓”二代刷脸支付机具刚刚上线创下一个月出货一万台的数额,另一边,微信便紧随其后对其刷脸产品“青蛙”进一步升级,并将其作为了智慧零售战略中的重要一环。
金额上,这边支付宝刚宣布投入30亿培育生态,那边就有服务商透露,微信将补贴100亿教育市场。
尽管传言的真实性还有待证实,但是对于市场而言,这些都无异于是一枚重磅炸弹,带起了一场关于刷脸、关于视觉的浩荡变革。未来,哪怕身处五线小城,刷脸也将成为企业标配。
而在变革之后,三维视觉这一最重要的产业基础则决定了刷脸行业的真实发展速度。
通过将识别的维度从二维提升到三维,三维视觉技术一举攻破了照片造假、化妆、面具等一众原先二维视觉所无法应对的难题,进一步将刷脸,这一高隐私、高风险、高价值的技术正式带向产业应用。
当然,争议也一直存在。就在不久前,两大国产手机的老大哥,就因为三维视觉的使用在微博上开始了隔空掐架。
这边,荣耀副总裁熊军民说搭载ToF(三维视觉的一种)方案的荣耀V20是行业标杆;另一边,小米副总裁卢伟冰立刻回敬,此ToF是骗用户瞎花钱的噱头。
更进一步,以商汤、旷视、云从、依图为代表的四家AI明星企业在今年也纷纷大力布局起了三维视觉,而以奥比中光、华捷艾米为代表一众上游硬件厂则已经摩拳擦掌数年只待今日爆发。
那么,放眼如今,引起一众阿里、腾讯、华为、小米、商汤等巨头与明星企业们明争暗夺的三维视觉技术究竟落地到了何处?
在赛道之中,谁成为了最早的获利者,谁又在赛程的前半局奋力抢夺下了入场的门票?
而在这场狂欢背后,谁又成为了产业链背后默默收割红利的一批玩家,他们又如何看待这个市场?
通过走访奥比中光、北京深视等代表性企业,以及对多位行业专家的资讯,我们试图还原这场从技术蔓延到业界,从工业应用拓展到消费品,并逐渐走向千家万户的技术以及产业的发展始末与内在的变革驱动所在。
技术落地的滚滚红利已经开启,谁会是最终赢家,答案,或许早已在多年前埋下了伏笔。
技术溯源:一场由苹果Face ID引发的行业狂欢
前年发售的iPhoneX上搭载的Face ID,被普遍认为是开启了三维视觉元年。
使用Face ID作为手机“密码”,我们不用担心“拿照片就能解锁”等安全问题,那是因为Face ID识别的人脸是三维的。
所谓三维视觉技术,简单说就是利用深度相机硬件及算法对物体进行识别,不仅识别事物的色彩和纹理,还能识别深度。
利用三维视觉技术可以在三维空间中跟踪事物的运动,使得识别更加准确、动态。
不过相对而言,这一技术门槛高、量产化难度大,行业壁垒高,一般而言,即使强悍如苹果也会采用收购的方式来进行相关方面的布局。
2013年,苹果收购了结构光方案先驱PrimeSense公司。
根据历史资料,这家公司的三维结构光方案曾应用于微软Kinect一代,而Kinect系列则可以称得上发展较早且最具代表性的主打三维视觉的体感游戏设备。
苹果将PrimeSense的三维视觉模组“小型化”到手机上,这是对三维视觉技术的潜能的大释放。
这不仅解决了三维视觉的手机端应用问题,还为之后的物联网故事做好了铺垫。
虽然此前三维视觉技术由来已久,但是由于硬件体积大、集成度低以及算法局限等问题,该技术主要被粗放地应用于工业生成、三维打印、自动化驾驶、体感游戏等大场景中。
现在,既然苹果的一个“小刘海”就可以容纳结构光三维视觉配件,那么可以推测以后各种物联网的终端就问题不大了。
三派纷争:结构光、ToF与双目视觉的技术大PK
尽管被统称为三维视觉,但是如果从技术流派上来说,目前市场上主流的方案企业是由三种构成:结构光法、飞行速度计算法(TOF)和RGB双目法。
Face ID、支付宝刷脸支付等应用使用的是结构光法。
结构光法不依赖于物体本身的颜色和纹理,而是采用主动投影已知图案的方法来识别物体。
这种方法识别分辨率较高,光线不足时也能识别;
但容易受强光干扰,且测量距离受限,一般在10米以内。
华为部分手机中所搭载的技术则是TOF方案。
TOF是Time of flight的简写,直译为飞行时间的意思,其基本原理是通过给目标连续发送光脉冲,然后用传感器接收从物体返回的光,通过探测光脉冲的飞行往返时间得出目标物的距离信息。
TOF的探测距离较远、帧率高、二次开发成本低、资源消耗少,虽然目前来说分辨率相对较低,但应用于一定领域的工业生成中已经没有问题。
在一些如智能货柜以及安防等场景中,双目立体视觉的应用则相对广泛。
其所搭载的深度相机类似人类的双眼,它和基于TOF、结构光原理的深度相机不同,它不对外主动投射光源,而是完全依靠拍摄的两张图片来计算深度。
这种方案的特性是对相机硬件要求低,且在室内外都能用,但是对匹配算法要求高,且不适用于单调缺乏纹理的场景。
以人脸解锁为练武场,产业链上下游的众多玩家纷纷露脸。
看硬件,有奥比中光、华捷艾米等深度摄像机硬件厂家;看算法,又不乏旷视、云从等AI算法明星企业;最后的落地,还闪现着腾讯、阿里等巨头的身影。
奥比中光副总裁孔博对智东西表示,“算法公司向硬件延伸,硬件公司向算法延伸”是产业玩家的新趋势。
目前中国的AI独角兽大多聚焦在AI垂直领域的算法平台或解决方案的市场中,也就是处于产业链中游或中上游,而硬件可以使软件算法落地,软硬件一体化可以让客户更省时便捷地采购与使用产品。
相机硬件商与算法商联合,将方案打包卖给互联网巨头、运营商,这成为上中下游三维视觉玩家典型的分工合作玩法。
三维视觉还涉及到一系列更偏上游的硬件生产商。
结构光方案的主要硬件包括四部分:
TX红外发射部分、RX红外接收部分、可见光摄像头、三维图像处理芯片,这使得舜宇光学、水晶光电、光迅科技等配件提供商也尝到了丰厚的市场红利。
但本文不对此进行详细解读。
最先火起来的手机刷脸:苹果、华为、小米纷纷入局
2017年9月13日,苹果Face ID发布,三维视觉正式走入大众的视线之中,也自此带起了一股手机行业的技术新浪潮。
尽管此前人脸识别解锁、支付,以及有部分厂家在进行尝试,但是相对而言由于缺少三维信息,因此很容易受到攻击以及欺骗。
比如同年9月21日,VIVO发布的主打人脸解锁功能的X20,使用的依然是二维的图像解锁,结果有网友用一张照片破解了它的解锁功能。
不过也有很多国内厂家及时的跟上了这一波浪潮,以华为以及小米为例,这两家企业在此前的新品上,分别搭载了不同的三维视觉方案。
其中,华为MATE和P系列用了结构光和TOF,而小米8透明探索版则使用的是结构光方案。
一直以来,小米的8都被认为是首款配备三维人脸解锁国产手机,不过其三维结构光技术来自以色列Mantis Vision公司。
顺便说一句,目前Mantis Vision的子公司螳螂慧视正在与百度大脑合计三维视觉的AI算法研究。
而后发布的OPPO Find X采用了国内奥比中光的三维视觉硬件及旷视科技的算法;
华为Mate 20 Pro上的三维结构光采用华为自研的算法。
到2018年底,三维人脸解锁几乎成了中高端智能手机的标配。
场景蔓延:从人脸支付到安防、工业
当上中下游的三维视觉玩家纷纷找到自己的伙伴,并达成一定默契,三维视觉技术的落地推进开始不断切入到更多垂直领域和场景。
如果说手机人脸解锁是众玩家的练兵试水领域,那么人脸支付则是互联网巨头主导下的矩阵式流量收割战场。
奥比中光副总裁孔博认为,除了人脸支付领域,三维视觉技术在安防、零售、工业质检的应用将会是新的风口。
为此,奥比中光已经布局轻量级智能安防市场,发力餐饮自助扫描、健身管理、服装定制等智慧零售领域,还推出三维光学测量解决方案矩阵应用于汽车、航空航天、机械工程等多个工业质检领域。
2018年4月,就在OPPO和奥比中光合作Find X的人脸解锁之际,奥比中光被支付宝挑中,共同成立了蚂里奥公司开发“人脸支付”。
支付宝还宣布,要在人脸支付领域投资30亿。
蚂里奥在18年12月发布了一代“蜻蜓”刷脸支付终端,打响了刷脸支付落地的第一枪。
今年年初,人们已经陆陆续续在高校宿舍、地铁进站口看见人脸支付自动柜的身影,这意味着三维人脸识别技术已经具有相当的准确率、安全性及成本可行性。
4月,二代“蜻蜓”发布,整机重量比一代减轻55%,经折叠和拆卸后如同书本般大小,可装进大衣口袋里。
在发布会现场,1000台机器在10秒内被抢光,仅仅两天之后,订单量就突破了1万台。
奥比中光成立于2013年,是一家提供三维传感解决方案的企业,专注于结构光、TOF、双目等技术方案,还有自研的三维图像处理芯片。
但支付宝一开始计划合作的并非奥比中光,而是另一家企业华捷艾米。
华捷艾米成立于2014年,以计算机三维视觉硬件及自研算法为核心,在新零售、智能家庭、消费电子、智能物流等领域提供三维视觉体感交互技术解决方案。
东边不亮西边亮,华捷艾米最终和另一大支付大亨微信站在了一起,并于2019年3月发布了“青蛙”刷脸支付终端。
据称,就技术而言,目前两大刷脸支付终端“青蛙”与“蜻蜓”并没有特别大的区别。
没过多久,5月9日,云从科技宣布正式发布一款最新的刷脸支付终端产品“CF-FP-E1”。
作为“CV四小龙”之一的以算法著称的科技公司,云从终于按捺不住,横刀植入刷脸支付战局以参与市场PK。
8月,云从科技的如意支付Pad作为全国首家通过了国家标准检测,这代表着人脸支付产业在朝着更加标准化的方向发展。
继手机人脸识别之后,借助互联网巨头及三维视觉大厂推起的刷脸支付的风口,三维视觉识别迎来新风口。
前瞻产业研究院报告显示,到2022年全球人脸识别市场规模将达75.95亿美元,增速达每年20%。
同时,刷脸支付场景众多。
阿里和腾讯等企业争夺的不仅是广为人知的餐厅、商场、超市等场景,还有各种公共服务端口及垂直领域。
在一些城市,地铁刷脸受到了政府的支持,今年4月济南已经开始实施三维刷脸进站;
医院也成为刷脸终端的栖息地,余杭区医疗已试点“蜻蜓”用于看诊挂号。
如果说人脸解锁的兴起,是人与手机设备的一种进一步融合,那么刷脸支付时代的到来,可以算是用户和商家关系的再一次重构。
顾客从繁杂的支付步骤中获得“豁免”,但同时也把主动权交到了商家手上。
在你进入商店被摄像头识别的那刻起,你的消费爱好、购物习惯数据就已经被机器调用,至于如何运用这些数据,聪明的营销家永远不会使你失望。
三维视觉技术虽然不直接带来这些后果,却在底层技术层面推动着这一切。
如果说依托三维视觉技术的刷脸支付正站在风口,那么新的风口在哪里呢?
在智能货柜、安防及工业应用领域,“精细化”的三维视觉展现出独特的问题解决潜力。
虽然在这些方面落地仍有一定的技术难度,赛道前景却十分宽广。
在安防领域,环境适应性差、场景理解受限、识别准确性不足等问题是AI应用中的主要痛点。
三维视觉技术能够解决遮挡、光照、角度等物体及环境的特征造成的误识率高问题。
目前,三维网络安防摄像机主要应用于安防反恐领域,尤其在边检安防领域。
部分省市的公安厅反恐项目中早已开始使用三维人脸识别技术,并建立了全国首个省级“三维人像数据库”。
2018 年10月通车的港珠澳大桥上更是首次大规模应用了三维人脸识别身份核验技术,智慧关卡全面采用“刷脸通行”,据称,车辆可在无感的条件下 8 秒通关。
但总的来说,三维视觉技术在泛安防领域的应用基本上还是一片处女地。
据了解,海康威视、的卢深视等多家企业已具备将三维视觉识别落地到安防的技术实力,但是安防硬件及方案的落地涉及整个安防生态,因此目前推进节奏并不及预期。
在工业应用方面,三维视觉技术在工业领域具有广阔的市场。
据前瞻产业研究院统计数据显示,单是工业质检领域,中国每天在产线上进行目视检查的工人超过350万,若按照工人的薪资计算,这可以被形容为一个千亿级的市场。
就拿工业质检来说,目前,由于环境复杂、2D视觉识别精度不达标等原因,工业质检领域的机器视觉的覆盖率不足5%。
工业质检的流程大致包括精准抓取、质量检测、顺畅传递等步骤,这就需要机器人不仅能识别产品的表面色彩和纹理,还要识别深度信息以及位置变化。
三维视觉技术能够有效提升产品良品率及生产效率,并有效降低人工成本。
在国内,海康威视、阿丘科技、远景智能等企业早已有所布局。
海康威视的三维激光轮廓传感器等产品能够进行非接触地高精度三维测量。
另外,在智能零售领域,无人销售货柜及无人超市的发展依赖三维视觉技术的进步。
深耕此领域的北京深视公司CEO张磊表示,三维视觉技术能有效解决普通二维动态视觉的高计算、背景难擦除等问题,也能顺势解决计算量的问题。
虽然近期资本和运营商对无人货柜的投入趋于冷静,但在技术已经有较高的成熟度的情况下,随着运营商落地流程和商业模式的进化,领域回暖指日可待。
虽然在三维视觉领域中结构光视觉技术应用最多,但TOF(飞行时间法)也越来越被关注。
当手机前置的结构光深度相机的进步空间越来越小,玩家们把目光投向了后摄,而后摄更适合TOF。
TOF的基本原理是通过发射器发射光脉冲到达物体所用的时间来计算被测物体离相机的距离,当测量点足够多的时候就能实现三维物体描绘。
这决定了TOF的特点是擅长远距离地识别体感动作。
TOF深度相机已被广泛应用于自动驾驶、VR游戏等领域。
当“浓缩”到手机等小型终端上,它能为我们带来有趣的创作体验,包括人物识别、MR游戏、体型测量、AR尺子、Emoji表情、三维抠图、三维建模、体积测量等多种功能,甚至实现现场景置换、人物置换、人体部位置换等功能。
但是,TOF的技术受光照环境影响大、硬件成本较高、反光微弱的深黑物体难以测量,不过这也成为技术进步和产品升级的突破点。
据了解,TOF的主要门槛在芯片,随着英飞凌、德州仪器等“大厂”发力手机端TOF方案,这为模组厂商乃至整个TOF产业的爆发酝酿了机会。
近日,三星发布的Note10系列手机就配备了TOF后摄,它能够拍摄“布娃娃”等事物的三维图,并通过算法使得三维“布娃娃”模仿镜头里的人的动作,妙趣横生。
▲用三星Note10系列手机建模的三维布娃娃在随着人体舞动
其实早在18年12月,也就是结构光手机人脸识几近成熟的时候,荣耀发布的V20手机后摄就加持了TOF深度镜头。
通过TOF相机用户能实现三维视频瘦身、拍照优化等多功能。
19年4月,华为发布的有史以来口碑最好的P30系列手机,因为配备了三维 TOF镜头,可以进行相机拍照景深优化、360°全景拍摄等多种功能。
P30系列手机成为华为和苹果市场比拼中的重要着陆。
19年初小米9没有搭载这一功能,但是小米副总裁卢伟冰就此和荣耀的发言人“荣耀老熊”展开了一场论战。
卢伟冰称,TOF只是个噱头没有太大的实际效用,是来骗钱的,小米技术预研早就“Ready”却没有采用。
但小米高管置身这场论战之中这件事本身,恰恰证明了三维 TOF视觉技术是值得被讨论的。
“荣耀老熊”表示,荣耀认为三维TOF将是未来手机最重要的发展方向之一。
他认为,未来TOF能够突破性的将现实世界物体、人像、空间虚拟化,这是AR、VR应用场景的必备能力,这也必将是5G移动互联网最重要的应用场景之一。
如果说前摄结构光镜头带来的人脸解锁使人与手机终端的交互更加顺畅,那么后摄TOF镜头则使得人与手机终端的关系变得妙趣横生。
虽然目前手机TOF相机主要用于测距、美颜、简单建模等功能,但随着TOF硬件的功耗及成本的优化,手机三维建模、AR应用将不再遥远。
在TOF三维视觉的发展中,目前深度信息的获取能力和抓取精度仍是两大瓶颈,且更适合小物体三维建模。
随着5G的来临,三维深度相机硬件及三维图像处理芯片及算法模型的进一步发展,三维视频通话、手机远程VR,虚景+实景的远程AR等用户使用量、需求量将迎来爆发式增长,这也预示着AR将不再是手机的附属品。
结语:被低估的三维视觉将改变人类交互方式
苹果的Face ID像一颗火种,将三维视觉技术浓缩化、精细化,进而在手机人脸解锁、人脸支付、三维视觉创作领域释放出燎原之势。
而后,众多玩家纷纷各显神通,深度相机硬件商与算法商联合,将方案打包卖给互联网巨头、运营商,这成为上中下游三维视觉玩家典型的分工合作玩法。
精通三维人脸解锁方案的奥比中光、云从科技等硬件和算法厂商们纷纷转而关注人脸支付,和腾讯、阿里等互联网巨头在刷脸吃饭、刷脸进站、刷脸挂号等场景中浅唱共舞,让三维视觉又火了一把。
未来,安防、工业应用、智能零售等领域有望带来三维视觉技术新的风口。
而在智能手机领域,华为率先攻下三维TOF技术难题,并落地在其里程碑产品P30系列手机上,提供三维优化拍照、360°全景拍摄等功能,还引来三星等厂家的跟风比拼。
这一发展趋势为AR视频通话、三维建模等手机功能带来曙光,到时候AR还是手机的附加属性吗?
奥比中光副总裁孔博表示:
“目前三维视觉现在还在初级阶段,未来还会不断地迭代和提升,将被应用于AIoT多个领域,有非常大的发展空间。
”三维视觉技术不仅孕育着一个被低估的市场,作为一种新的感知方式,它还有望颠覆性地改变人与机器、人与人的交互方式。
(本账号系网易新闻·网易号“各有态度”签约帐号)