从算法到软硬一体,旷视要为智能手机带来更逼真的未来

2018 年 8 月 16 日 PingWest品玩

3D 视觉的加入,将为智能手机带来更多交互的可能性。

OPPO Find X 滑动中框升起降落的转瞬之间,基于 3D 结构光的人脸解锁完成了从验证到通过的整个的过程。

轻快、顺畅、省心。这样的体验基于能实现活体检测的 3D 结构光技术。

除了解锁手机,支付宝支付同样也能被 3D 结构光惠及,与此同时,Android 版的微信支付也即将加入 3D 结构光解锁。而支付场景其实只是未来智能交互的新模式的冰山一角。当 3D 视觉加入智能手机,交互可能性只会更加扩大。

毫无疑问,智能手机与 3D 视觉已经成为计算机视觉领域的关键词。

可以想见的是,在不远的将来,如此顺畅的体验也即将被更多的用户所感受到,其前提是以 3D 结构光或者 TOF 技术能被更多的终端产品所搭载。

各个终端厂家对于此自然是功不可没,但是终端厂家背后的算法提供商也不能不提,甚至一定程度上,这些 3D 视觉算法提供方更应该被视为整个行业发展向前的一大助推力。

单论 3D 视觉领域的技术,旷视科技 Face++ 不能不提,甚至他们的技术已经得到了颇多展示。

且不提他们在安防等专业领域的技术积累,一个最简单的例子,本文开头提到的 OPPO Find X 所搭载的 FaceKey 便是基于旷视的技术。

在我们的体验中,OPPO Find X 的 FaceKey 安全性非常高,甚至是伪造得十分逼真的硅胶人脸模型也不能解锁,与之相对的是,iPhone X FaceID 则没有通过这轮考验。而这得益于旷视自研的 3D 算法模型结构,以及十亿级人脸数据的训练和数近百万张 benchmark 测试。也正是因为旷视独有的算法优势,OPPO Find X 能实现有趣又好玩的影棚特色光效。

vivo 于在此前 MWC 上发布的原型机,支持 3D 建模、3D 美颜和整形功能,则展示了旷视科技在 TOF 技术上的造诣。

至于今年云栖大会上,旷视联合  Altizure 全景 3D 重建的云栖小镇,也只是他们技术硬实力的侧面体现。

发展到如今的高度整合程度,实际上,如今的智能手机,尤其是旗舰智能手机远不是简单的屏幕、摄像头、处理器、内存等硬件组合到一起,再刷入智能操作系统那么简单。

以 iPhone X 所搭载的 3D 结构光为例,有行业内部人士透露,实际上,苹果早在 2016 年就做了四万台搭载这一技术的原型机,但直到 2017 年 9 月,顶着刘海搭载结构光的 iPhone X 才最终与消费者见面。

整合供应方的复杂程度远超外界的想象。每一项尖端的全新技术加入都会牵涉到从算法到硬件再到应用层面落地的一整套供应链。

如何有效地整合供应链,这是一个摆在各个厂家面前的问题。

针对这一问题,作为机器视觉巨擘之一的旷视 Face++,日前提出了全新移动端 3D 感知全栈解决方案。这也是 3D 视觉领域内首个完整的从 AI+3D 算法到硬件再到解决方案的一揽子解决设计。旨在为各个相关厂家提供高效快速的完整解决方案。

这套从上往下的整合方案分为四层,算法、应用、解决方案层和硬件层。

旷视科技 Face++ 高级副总裁吴文昊在发布会上提到,“旷视之前核心竞争力其实是在最上面两层,视觉的应用层 FaceID以及核心的 AI 能力层。”

上文提到的 OPPO 与 vivo 例子也基本都集中于这两层面。

术业有专攻,在 Face++ 提出的这套解决方案中,也涵盖了其余厂家的技术。

在这场旷视主办的发布会上,传感器解决方案设计和制造商艾迈斯半导体、移动端 3D 面部扫描先锋企业 Bellus3D、以光场采集、处理、显示为核心解决方案的叠境数字科技(DGene),以及珠科创新(Altizure)的企业代表也陆续登台。

这几个企业皆为 3D 视觉领域的排头兵,具备极强的专业技术实力。他们与旷视一起达成了共识,未来将对 3D 应用层、AI算法、解决方案及摄像、传感等硬件设备进行垂直整合,并逐步完善 3D 产业生态。

在一众行业大佬的畅谈中,未来 3D 应用得到了描绘:把整个世界的三维采集下来,结合着 VR/AR,向消费者展示一个更逼真的三维世界。

这并非是单纯的畅想。在 iPhone X 的标杆引领作用下,有数据显示,从 2017 年到 2018 年,搭载 3D 传感器的的智能手机出货量从 3800 万台激增到了 1.42 亿台,有预计显示,到 2020 年,这个数字将会是 9.05 亿台。

如果预计为真,终端数量的爆发增长背后是整套方案,旷视拿出的这套 3D 感知全栈解决方案将居功至伟。



运营人要用高转化文案打造流量爆款

产品人要用高转化文案吸引用户留存

市场人要用高转化文案保证品牌宣传


整个互联网都在挖掘的高转化文案究竟怎么写?


前蓝色光标数字营销高级总监,博雅未来创始人王超

解剖五十余个公众号,复盘近百篇优秀转化文案

从标题、第一段、配色……多角度深度解析

一键入门文案写作,开启高转化文案创作

14课时完整学习,限时优惠价99元



扫描下图二维码报名学习吧!


登录查看更多
0

相关内容

3D是英文“Three Dimensions”的简称,中文是指三维、三个维度、三个坐标,即有长、有宽、有高,换句话说,就是立体的,是相对于只有长和宽的平面(2D)而言。
【CVPR2020-旷视】DPGN:分布传播图网络的小样本学习
专知会员服务
27+阅读 · 2020年4月1日
【芝加哥大学】可变形的风格转移,Deformable Style Transfer
专知会员服务
31+阅读 · 2020年3月26日
【北京大学】CVPR 2020 | PQ-NET:序列化的三维形状生成网络
2019中国硬科技发展白皮书 193页
专知会员服务
84+阅读 · 2019年12月13日
旷视研究院新出8000点人脸关键点,堪比电影级表情捕捉
人工智能前沿讲习班
19+阅读 · 2019年5月4日
值得收藏丨一文读懂人脸识别技术
物联网智库
4+阅读 · 2019年2月11日
华为Mate20系列4款新机发布,售价最高超一万六
DeepTech深科技
3+阅读 · 2018年10月17日
深度相机应用全面梳理:多点开花,定点爆破
计算机视觉life
6+阅读 · 2017年12月13日
【智能零售】零售业的未来是让零售变得无界
产业智能官
3+阅读 · 2017年10月18日
Learning Implicit Fields for Generative Shape Modeling
Arxiv
10+阅读 · 2018年12月6日
Arxiv
5+阅读 · 2018年10月15日
Text classification using capsules
Arxiv
5+阅读 · 2018年8月12日
Arxiv
151+阅读 · 2017年8月1日
VIP会员
Top
微信扫码咨询专知VIP会员