项目名称: 基于三维视觉及形状匹配的全自由度自然手势识别

项目编号: No.61203317

项目类型: 青年科学基金项目

立项/批准年度: 2013

项目学科: 自动化学科

项目作者: 刘敏

作者单位: 清华大学

项目金额: 24万元

中文摘要: 基于视觉的手势识别是利用视频手势进行自然人机交互的关键。受限于2D计算机视觉技术的约束,目前基于视觉的手势识别系统在实际推广中还存在许多技术难点,主要包括复杂背景下的手势分割;手势模型的高自由度所带来的识别难度;视角与遮挡造成的识别准确度差;以及动态手势跟踪与识别中的计算复杂度等问题。深度摄像机的推广应用为手势识别带来了新的机遇和挑战。本课题基于深度摄像机所获取的3D视频手势,以全自由度关节模型驱动的三维动态可变形虚拟手网格建模为切入点,重点研究三维关节变形体的部分形状匹配技术,通过形状检索及模板匹配技术获得静态手形关节参数估计。以手形参数为基础,融合手势的位置、方向及空间运动轨迹,课题进一步研究基于虚拟手模型的动手势参数轨迹与参考模板之间的弹性匹配问题,并考虑人手校正,提高系统的识别精度,从而为基于3D摄像机的动静态手势识别系统提供关键技术和支撑框架。

中文关键词: 手势识别;深度摄像机;部分形状匹配;三维视觉;

英文摘要: Direct use of the hand as an input device is an attractive method for providing natural human-computer interact. To this aim, the research on vision-based hand gesture recognition is a key. However, limited by the tranditional 2D computer vision technology, current vision based hand gesture recognition systems suffer a series of challenges which have to be overcome for the widespread use of this technology. The main difficulties incldue uncontrolled environment, high-dimensional parameters, view dependence and self occlusions, processing speed in rapid hand motion tracking. This project is based on the color and depth images obtained by a depth camera. The key idea for hand gesture recognition starts from a virtual hand model, which is an deformable hand mesh driven by a full DOF skeletal model. We propose to use the template based posture estimation technique to fulfill the static posture recognition task. The 3D partial shape matching techniques are to be studied to obtain the set of full DOF joint parameters from the input partial hand surfaces. Based on the hand posture parameters, combining the location, orientation and kinematic parameters, we further study the problem of elastic matching between the template and the parametric trajectory for the input temporal posture. Automated hand caliberation problem

英文关键词: hand gesture recognition;Depth Camera;Partial shape matching;stereo vision;

成为VIP会员查看完整内容
0

相关内容

基于RGB-D图像的语义场景补全研究进展综述
专知会员服务
29+阅读 · 2021年11月8日
专知会员服务
67+阅读 · 2021年5月21日
专知会员服务
16+阅读 · 2021年5月13日
专知会员服务
61+阅读 · 2021年3月25日
【NeurIPS 2020】一种端到端全自由度抓取姿态估计网络简介
专知会员服务
20+阅读 · 2020年10月18日
基于深度学习的手语识别综述
专知会员服务
47+阅读 · 2020年5月18日
综述 | 激光与视觉融合SLAM
计算机视觉life
18+阅读 · 2020年10月8日
ECCV2020 | SMAP: 单步多人绝对三维姿态估计
学术头条
10+阅读 · 2020年8月9日
最新开源 RGBD+IMU数据集:FMDataset
计算机视觉life
42+阅读 · 2019年9月21日
【泡泡图灵智库】协同视觉-惯性SLAM
泡泡机器人SLAM
29+阅读 · 2019年9月6日
ICRA 2019 论文速览 | 传统SLAM、三维视觉算法进展
计算机视觉life
50+阅读 · 2019年7月16日
SkeletonNet:完整的人体三维位姿重建方法
计算机视觉life
21+阅读 · 2019年1月21日
一种轻量级在线多目标车辆跟踪方法
极市平台
13+阅读 · 2018年8月18日
Maplab:研究视觉惯性建图和定位的开源框架
泡泡机器人SLAM
16+阅读 · 2018年4月4日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
2+阅读 · 2012年12月31日
国家自然科学基金
3+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2011年12月31日
国家自然科学基金
2+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
Arxiv
0+阅读 · 2022年4月20日
Arxiv
1+阅读 · 2022年4月19日
Arxiv
0+阅读 · 2022年4月19日
2D Human Pose Estimation: A Survey
Arxiv
0+阅读 · 2022年4月15日
Arxiv
0+阅读 · 2022年4月14日
小贴士
相关VIP内容
基于RGB-D图像的语义场景补全研究进展综述
专知会员服务
29+阅读 · 2021年11月8日
专知会员服务
67+阅读 · 2021年5月21日
专知会员服务
16+阅读 · 2021年5月13日
专知会员服务
61+阅读 · 2021年3月25日
【NeurIPS 2020】一种端到端全自由度抓取姿态估计网络简介
专知会员服务
20+阅读 · 2020年10月18日
基于深度学习的手语识别综述
专知会员服务
47+阅读 · 2020年5月18日
相关资讯
综述 | 激光与视觉融合SLAM
计算机视觉life
18+阅读 · 2020年10月8日
ECCV2020 | SMAP: 单步多人绝对三维姿态估计
学术头条
10+阅读 · 2020年8月9日
最新开源 RGBD+IMU数据集:FMDataset
计算机视觉life
42+阅读 · 2019年9月21日
【泡泡图灵智库】协同视觉-惯性SLAM
泡泡机器人SLAM
29+阅读 · 2019年9月6日
ICRA 2019 论文速览 | 传统SLAM、三维视觉算法进展
计算机视觉life
50+阅读 · 2019年7月16日
SkeletonNet:完整的人体三维位姿重建方法
计算机视觉life
21+阅读 · 2019年1月21日
一种轻量级在线多目标车辆跟踪方法
极市平台
13+阅读 · 2018年8月18日
Maplab:研究视觉惯性建图和定位的开源框架
泡泡机器人SLAM
16+阅读 · 2018年4月4日
相关基金
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
2+阅读 · 2012年12月31日
国家自然科学基金
3+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2011年12月31日
国家自然科学基金
2+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
微信扫码咨询专知VIP会员