「深度」手势识别已起步,行业者还需找准刚需厚积薄发

2017 年 7 月 28 日 镁客网 伶轩


手势识别是交互体验最基本的需求,精准与实时为关键所在。


这是一个奇怪的现象,突然爆发的行业火着火着就冷了,如虚拟现实;

这也是一个意料之中的现象,因为即便概念再火,不能真正落地也终是枉然,如VR交互式体验。

交互体验概念虽已打出许久

但仍处于 “被呐喊”的阶段


据不完全统计,截至2016年上半年,国内VR行业投融资事件共有117起,总投资规模超40亿元。其中2015年全年投融资事件有57起,投资规模为24亿元;2016上半年投资事件有38起,投资规模为15.4亿元。而到了2016年下半年,VR领域的投融资事件已鲜有听闻。

可以看到,国内的VR热在2016年下半年急速冷却。对此现象,行业的普遍解释是:VR不过刚刚开始发展,落地挣钱太难;体验者对此的评价则是:VR没有想象中带感,仅游戏方面,VR体验与普通的网游体验并没有实质性的差别,而且时间短、消费高。

但如果从深处究其原因,一个新兴行业的发展需要有其自己的特色,而从行业开始呐喊VR至今,所强调的就是其强大的交互能力和沉浸感。但很显然,交互不足、沉浸感不强,才是现在国内VR行业的真实写照。对于一个凭体验效果判定产品好坏的行业来说,概念打了太久却一直无法实现,这可谓是致命的。

心动手动

手势识别是交互体验最基本的需求


“从当前行业发展情况及用户需求来看,VR/AR头显厂商以及开发者对交互升级的需求越来越迫切,自然交互已经成为大势所趋。而手部的跟踪与识别技术作为自然交互的基础,也因此受到了行业的广泛关注和看好。” Leap Motion全球副总裁、大中国区总裁谭家东说。

手,一向是人体一切动作的先行及操作部件,心动则手动,例如从昏迷中醒来的人首先苏醒的就是手指。而在交互体验中,手部动作信号是否能够被精确识别与实时传输则直接影响着整体体验效果。

有过VR体验相关经验的人应该知道,现如今大多的VR体验除需要戴上头显之外,为了能更好的与虚拟世界进行操作与互动,通常还需要用户手持一个或两个手柄。从镁客网了解的情况看,用户在手持设备进行体验时通常有着以下三个困扰:

1.体验之前需要先学习怎么操作手柄;

2.手柄前期校准耗时;

3.设备间信号传输有延时,极其影响体验效果。

而如果想要体验者彻底沉浸于虚拟世界,厂商最基本要做到的就是,让用户用最简单、最自然的方式进行无差别体验。“可以问一下自己,在体验中,你是否觉得在虚拟世界里的手就是自己现实中的手?这是衡量手势识别技术好坏的最重要标准。” 谭家东说。

手势识别技术花样繁多

按需选择方不浪费资源


不妨想象一下,如果你在家看电影时突然来了个电话,只要将手抬至屏幕前方画面就可暂停,是不是很快速?而当你看到一个精彩镜头想要回放,只需要抬手在屏幕前方滑动一下,是不是很方便?

你还可以想象一下,当你在VR游戏体验中想要给队友打暗号时,只要在现实世界中用手打个暗号就可以达到目的,是不是很爽?

可能在十年前,上述的三个情境还只是科幻想象而已,但如今,它却实实在在已经来到了我们身边。此外,虽然这三个情境都是依靠手势识别技术实现的,但它们实际上用到了三类技术,从简单的到复杂精细依次分为:二维手型识别、二维手势识别及三维手势识别。

二维手型识别,是手势识别中最为简单的一类技术。该技术可获取二维静态手势,帮助用户用手型控制设备。这类技术的缺点就是不能识别动态手势,只能识别预设好的静态手型,拓展性差;而优点就是,该技术实质上是一种模式匹配技术,研发难度及硬件要求低;

二维手势识别,与手型识别一样,不含深度信息,但它可以识别动态手型以及追踪简单的二维手势动作,例如对着摄像头进行滑动操作。这一技术可为用户提供更为丰富的人机交互服务,体验感有所增强,目前已在电视领域有所应用;

三维手势识别,是当下最炙手可热的手势识别技术类别,所输入的是包含深度的三维信息,不仅可以识别手型、手势,还可以从三维层面追踪手部动作,为用户提供随心所欲的手部操控体验,应用场景广。但此类技术研发难度高、周期长且对硬件的数量及性能要求都大有提高,也因此成本较高,难在C端得以普及。

“在2017年,我们都应该玩起三维手势了,深度信息是以后主流。”某黑科技发烧级玩家说。诚然,当前三维手势识别是最先进、体验效果也是最好的。但可以看见,不同的手势识别技术都有其优缺点,在整体技术发展不够成熟的当下,依据应用场景的实际需求,选择合适的技术辅以支撑,方能以最低的成本获得可满足需求的体验效果,不致资源浪费。

手势识别能否成为理性刚需

还需先做到精准与实时


“高鲁棒性、高精度、高刷新率和低延迟的手部追踪是沉浸感的真正来源。就是一直找不到理性刚需应用点。”凌宇智控CEO张道宁说。

就当前行业发展情况来看,在大多数情况下,用户并不能体验到完全准确无误的手势识别服务。其中,最为主要的问题有以下三个:

1.鲁棒性差,直接降低交互强度,使体验效果变差。举个例子,当你在游戏对战中用手势向敌人进行了5次进攻,前4次都准确打到了对方,却在第5次进攻时出现了偏差或者攻击发射不出去,导致你Game over了,你还有继续玩下去的欲望吗?当前的手势识别技术在原理上就存在着准确性不高的缺陷,一旦应用到实际场景中,很有可能会带来不好的交互体验,这也是为什么当下大多的体验式场景中,用户宁用操控手持设备的重要原因之一;

2.没有反馈,用户在虚拟世界中得不到物理反馈。以当前的手势识别技术发展情况看,研发商们还无法给用户提供实时的物理反馈。打个比方,你在虚拟世界中射了一箭,如果是手持设备,只要手柄上的按钮切切实实被按动了,即便有延迟你不能看到箭射了出去,你还是能确信这一箭你射了。而如果仅靠手势识别技术,在有延迟或者其他情况下,看不到实际效果就不能确信你是否操作成功,不知道自己到底有没有对虚拟世界产生作用,也就没有获得真正沉浸感的体验。

3.追踪范围有限,手部动作信号必须在能被捕捉到的范围内进行,体验时需要时时注意,不能随心所欲。此外,由于手势识别技术门槛高,其对硬件、技术等要求极高,也直接导致了该技术研发周期长、资金耗费大,运行时功耗高,而精度却没有质的提升,让手势识别行业者一直被圈于“做Demo,讲故事”的怪圈。

巨头布局下的市场正在拓展

国内厂商厚积薄发之时到了


然而,即便当下手势识别技术还不够成熟,但正如那位发烧友所说,手部深度信息识别是今后的体验主流。

“手势识别是交互技术的一种,可以应用在多个领域,除当下比较火的虚拟现实领域之外,在教育领域、医疗、传统工业等领域的应用场景也正在开发中或已有所应用。”专注于惯性传感器动捕系统研发的Xptah创始人&CEO陈会兵说。

随着近年来更多商业化应用的出现,手势识别市场规模正在急速扩大。今年三月,市场分析公司Markets and Markets曾发表报告称,到2024年,手势识别和无触碰感知的市场规模将达到340亿美元。而此前更有数据显示,早在2014年,全球手势识别与传感器市场达到了31.2 亿美元的规模,复合年增长率为32.78%。

可以看到,谷歌、苹果、英伟达、亚马逊、微软等在手势识别领域均有布局,如微软的手势识别追踪技术handpose、谷歌将于今年发布的Project Soli手势识别芯片、亚马逊获得的AR手势识别专利等,涉及了智能家居、AR/VR、芯片、自动驾驶等各大硬科技领域。

而随着国内市场环境的改善,接受能力快、学习及创新能力强的手势识别技术公司也开始渐渐崭露头角,如凌感、诺亦腾等。顺应而来的,很多国外的技术开发商开始在中国设立海外办公室,与国内硬件厂商、内容开发商合作,共同打开中国市场,如即将在中国设立海外办公室的Leap Motion等。“我们非常欢迎越来越多的领先企业和我们一起去研究探索,研发出最好的自然交互解决方案。交互问题的解决可以带动整个行业的发展,希望我们大家可以伴随着行业共同成长。”

总结


虽然目前手势识别技术发展不够成熟,各种问题仍旧阻碍着用户体验效果的提升。但不可否认的是,手势识别技术是交互式体验不可或缺的重要组成部分。行业发展早期,还需研发商戒骄戒躁,基于传统交互手段,稳步提高手势识别精准度与实时性,给予用户虚拟及现实的沉浸体验。

/- 推荐阅读 -/


▲「深度」马云推出淘咖啡,刘强东忙着憋大招:无人超市是真有料还是在玩模式?


▲  「人物特写」清华大学邓志东:“特征提取+推理”的小数据学习才是AI崛起的关键


▲  「深度」车企挂名背后,百度通过Apollo拿到自动驾驶数据恐非易事

镁客网


科技 | 人文 | 行业

微信ID:im2maker
长按识别二维码关注

硬科技第一产业媒体

提供最有价值的行业观察

登录查看更多
6

相关内容

IEEE虚拟现实会议一直是展示虚拟现实(VR)广泛领域研究成果的主要国际场所,包括增强现实(AR),混合现实(MR)和3D用户界面中寻求高质量的原创论文。每篇论文应归类为主要涵盖研究,应用程序或系统,并使用以下准则进行分类:研究论文应描述有助于先进软件,硬件,算法,交互或人为因素发展的结果。应用论文应解释作者如何基于现有思想并将其应用到以新颖的方式解决有趣的问题。每篇论文都应包括对给定应用领域中VR/AR/MR使用成功的评估。 官网地址:http://dblp.uni-trier.de/db/conf/vr/
【KDD2020】多源深度域自适应的时序传感数据
专知会员服务
62+阅读 · 2020年5月25日
深度神经网络实时物联网图像处理,241页pdf
专知会员服务
77+阅读 · 2020年3月15日
【德勤】中国人工智能产业白皮书,68页pdf
专知会员服务
304+阅读 · 2019年12月23日
2019中国硬科技发展白皮书 193页
专知会员服务
83+阅读 · 2019年12月13日
何晖光:多模态情绪识别及跨被试迁移学习
深度学习大讲堂
55+阅读 · 2019年4月23日
鼠标终将消失,未来我们有哪些人机交互方式?
人工智能学家
5+阅读 · 2018年11月25日
【机器视觉】机器视觉全面解析
产业智能官
12+阅读 · 2018年11月12日
中央再批人工智能伪创新,90%以上AI都不靠谱
THU数据派
7+阅读 · 2017年12月6日
【前沿】凌空手势识别综述
科技导报
12+阅读 · 2017年8月17日
深度解读 | 为何众科技巨头都在抢滩语音识别技术?
Arxiv
5+阅读 · 2018年4月13日
Arxiv
4+阅读 · 2018年3月30日
Arxiv
10+阅读 · 2018年2月17日
VIP会员
相关资讯
何晖光:多模态情绪识别及跨被试迁移学习
深度学习大讲堂
55+阅读 · 2019年4月23日
鼠标终将消失,未来我们有哪些人机交互方式?
人工智能学家
5+阅读 · 2018年11月25日
【机器视觉】机器视觉全面解析
产业智能官
12+阅读 · 2018年11月12日
中央再批人工智能伪创新,90%以上AI都不靠谱
THU数据派
7+阅读 · 2017年12月6日
【前沿】凌空手势识别综述
科技导报
12+阅读 · 2017年8月17日
深度解读 | 为何众科技巨头都在抢滩语音识别技术?
Top
微信扫码咨询专知VIP会员