基于视觉注意的手势交互技术研究 - 专知基金

会员服务 ·

0

人机交互 · 视觉注意 ·

2012 年 12 月 31 日

基于视觉注意的手势交互技术研究

国家自然科学基金

国家自然科学基金委员会

项目名称： 基于视觉注意的手势交互技术研究

项目编号： No.61202344

项目类型： 青年科学基金项目

立项/批准年度： 2013

项目学科： 计算机科学学科

项目作者： 武汇岳

作者单位： 中山大学

项目金额： 25万元

中文摘要： 视觉手势交互技术是自然用户界面的主流方式和热点问题之一。针对目前视觉手势交互中存在的"Midas Touch"瓶颈问题，从视觉注意感知模型、手势识别与交互技术以及应用验证几方面展开研究:（1）基于认知心理学what-where两条通路理论，构建融合自顶向下和自底向上注意的层次并行感知模型，以此来影响视觉注意，将注意吸引到显著的手势动作区域，为空间连续动态手势识别提供高层的理论指导;（2）基于视觉选择性注意、预注意和集中注意机制，提出一种鲁棒的空间连续动态手势识别方法，为视觉手势交互技术设计提供基础算法支撑和技术准备;（3）在总结现有视觉手势交互特征的基础上，面向交互式数字电视，设计出一套基于精确交互任务的视觉手势交互技术，提高视觉手势执行交互任务的能力。本项目对视觉手势交互理论的完善、创新性方法和技术的研究以及在各个领域的应用推广具有重要的理论和应用价值。

中文关键词： 人机交互；用户界面；手势；视觉注意；感知

英文摘要： In order to solve the "Midas Touch" problem existing in vision-based gesture user interfaces, we provide a general solution and a unified platform based on the visual attention theory of cognitive psychology. Firstly, we propose a parallel perception model that combines bottom-up attention with top-down attention of human visual perception mechanism, which is considered as the theoretical guidance for continuous spatio-temporal dynamic gestures spotting and recognition. Secondly, we present a robust dynamic gesture recognition method based on selective attention, divided attention and sustained attention to provide a new perspective for solving the "Midas Touch" problem. Thirdly, we build a gesture toolkit and design a set of gesture interactive techniques, which is valuable for improving the interactive ability of vision-based gestures. Finally, we present a system prototype and experiment evaluation based on interactive digital television. Based on the research of this project, we are going to explore the new breakthrough point of cognivive psychology and computer vision, which is meaningful for the improvement of vision-based gesture user interface theories, methods and techniques.

英文关键词： Human-Computer Interaction；User Interface；Gesture；Visual Attention；Visual Perception

成为VIP会员查看完整内容

0

相关内容

人机交互

人机交互( Human–computer Interaction )是一门研究系统与用户之间的交互关系的学问。系统可以是各种各样的机器，也可以是计算机化的系统和软件。

【博士论文】视觉语言交互中的视觉推理研究

【博士论文】视觉语言交互中的视觉推理研究

专知会员服务

64+阅读 · 2021年12月1日

南开大学范登平的博士论文《认知规律启发的显著性物体检测方法与评测》

南开大学范登平的博士论文《认知规律启发的显著性物体检测方法与评测》

专知会员服务

23+阅读 · 2021年11月25日

基于RGB-D图像的语义场景补全研究进展综述

基于RGB-D图像的语义场景补全研究进展综述

专知会员服务

29+阅读 · 2021年11月8日

动态手势理解与交互综述

专知会员服务

33+阅读 · 2021年10月11日

三维视觉前沿进展

专知会员服务

67+阅读 · 2021年5月21日

图像描述生成研究进展

专知会员服务

70+阅读 · 2021年3月29日

基于视觉和语言的跨媒体问答与推理研究综述

专知会员服务

32+阅读 · 2021年3月17日

光场显著性检测研究综述

专知会员服务

19+阅读 · 2020年12月23日

【浙大博士论文】面向复杂场景理解的视觉内容识别、检测与推理方法研究

【浙大博士论文】面向复杂场景理解的视觉内容识别、检测与推理方法研究

专知会员服务

147+阅读 · 2020年7月26日

基于视觉的三维重建关键技术研究综述

基于视觉的三维重建关键技术研究综述

专知会员服务

166+阅读 · 2020年5月1日

《自然》：机器视觉行为理解与脑神经有内在关联？上交卢策吾团队构建映射模型

《自然》：机器视觉行为理解与脑神经有内在关联？上交卢策吾团队构建映射模型

机器之心

1+阅读 · 2022年4月16日

微软亚洲研究院多模态模型NÜWA：以自然语言创造视觉内容

微软亚洲研究院多模态模型NÜWA：以自然语言创造视觉内容

微软研究院AI头条

0+阅读 · 2022年3月3日

【博士论文】基于深度学习的单目场景深度估计方法研究

【博士论文】基于深度学习的单目场景深度估计方法研究

专知

0+阅读 · 2021年12月8日

【博士论文】视觉语言交互中的视觉推理研究

【博士论文】视觉语言交互中的视觉推理研究

专知

2+阅读 · 2021年12月1日

【博士论文】认知规律启发的显著性物体检测方法与评测

【博士论文】认知规律启发的显著性物体检测方法与评测

专知

4+阅读 · 2021年11月25日

图像描述生成研究进展

图像描述生成研究进展

专知

1+阅读 · 2021年3月29日

基于视觉和语言的跨媒体问答与推理研究综述

基于视觉和语言的跨媒体问答与推理研究综述

专知

5+阅读 · 2021年3月17日

【浙大博士论文】面向复杂场景理解的视觉内容识别、检测与推理方法研究

【浙大博士论文】面向复杂场景理解的视觉内容识别、检测与推理方法研究

专知

26+阅读 · 2020年7月26日

弱监督视觉理解笔记(VALSE2019)

弱监督视觉理解笔记(VALSE2019)

极市平台

27+阅读 · 2019年4月23日

【AIDL专栏】鲁继文：面向视觉内容理解的深度度量学习

【AIDL专栏】鲁继文：面向视觉内容理解的深度度量学习

人工智能前沿讲习班

32+阅读 · 2018年5月22日

基于RGB-D数据的个性化手势交互技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

深度学习框架下基于情境线索的视觉注意研究

国家自然科学基金

2+阅读 · 2015年12月31日

基于深度信息和显著计算的手势交互技术研究及应用

国家自然科学基金

1+阅读 · 2014年12月31日

视觉注意机制下基于深度概率图模型的情感计算

国家自然科学基金

2+阅读 · 2013年12月31日

基于视觉的智能机器人场景理解方法研究

国家自然科学基金

1+阅读 · 2013年12月31日

视觉注意模型及其在显著目标检测中的应用研究

国家自然科学基金

3+阅读 · 2013年12月31日

视觉注意的计算模型及其应用

国家自然科学基金

0+阅读 · 2012年12月31日

基于视觉和触觉感知的手势交互及其在运动康复中的应用

国家自然科学基金

2+阅读 · 2012年12月31日

基于多示例学习的视觉注意建模及应用研究

国家自然科学基金

1+阅读 · 2012年12月31日

基于视觉注意机制的多尺度图像融合的研究

国家自然科学基金

1+阅读 · 2009年12月31日

Review of Serial and Parallel Min-Cut/Max-Flow Algorithms for Computer Vision

Arxiv

0+阅读 · 2022年4月20日

Vision System of Curling Robots: Thrower and Skip

Arxiv

0+阅读 · 2022年4月20日

Time Domain Adversarial Voice Conversion for ADD 2022

Arxiv

1+阅读 · 2022年4月20日

Heterogeneous Feature Augmentation for Ponzi Detection in Ethereum

Arxiv

0+阅读 · 2022年4月19日

XLM-E: Cross-lingual Language Model Pre-training via ELECTRA

Arxiv

0+阅读 · 2022年4月19日

Non-Parallel Text Style Transfer with Self-Parallel Supervision

Arxiv

0+阅读 · 2022年4月18日

A Survey of Natural Language Generation

Arxiv

15+阅读 · 2021年12月22日

Meta-learning in natural and artificial intelligence

Arxiv

10+阅读 · 2020年11月26日

Image Captioning

Arxiv

11+阅读 · 2018年5月13日

Bottom-Up and Top-Down Attention for Image Captioning and Visual Question Answering

Arxiv

14+阅读 · 2018年3月14日

阅读: 0 点赞: 0

小贴士

登录享主题订阅及个性化推荐

相关主题

热门VIP内容

开通专知VIP会员享更多权益服务

操作系统智能体：基于多模态大模型（MLLM）的通用计算设备智能体综述

《美国太空军系统全生命周期建模、仿真与分析效能提升方案》最新84页报告

【博士论文】推进数据高效的深度学习：非参数 Transformer、主动测试与上下文学习

自主人工智能：未来战争是否将是自主化的？

相关VIP内容

【博士论文】视觉语言交互中的视觉推理研究

【博士论文】视觉语言交互中的视觉推理研究

专知会员服务

64+阅读 · 2021年12月1日

南开大学范登平的博士论文《认知规律启发的显著性物体检测方法与评测》

南开大学范登平的博士论文《认知规律启发的显著性物体检测方法与评测》

专知会员服务

23+阅读 · 2021年11月25日

基于RGB-D图像的语义场景补全研究进展综述

基于RGB-D图像的语义场景补全研究进展综述

专知会员服务

29+阅读 · 2021年11月8日

动态手势理解与交互综述

专知会员服务

33+阅读 · 2021年10月11日

三维视觉前沿进展

专知会员服务

67+阅读 · 2021年5月21日

图像描述生成研究进展

专知会员服务

70+阅读 · 2021年3月29日

基于视觉和语言的跨媒体问答与推理研究综述

专知会员服务

32+阅读 · 2021年3月17日

光场显著性检测研究综述

专知会员服务

19+阅读 · 2020年12月23日

【浙大博士论文】面向复杂场景理解的视觉内容识别、检测与推理方法研究

【浙大博士论文】面向复杂场景理解的视觉内容识别、检测与推理方法研究

专知会员服务

147+阅读 · 2020年7月26日

基于视觉的三维重建关键技术研究综述

基于视觉的三维重建关键技术研究综述

专知会员服务

166+阅读 · 2020年5月1日

相关资讯

《自然》：机器视觉行为理解与脑神经有内在关联？上交卢策吾团队构建映射模型

《自然》：机器视觉行为理解与脑神经有内在关联？上交卢策吾团队构建映射模型

机器之心

1+阅读 · 2022年4月16日

微软亚洲研究院多模态模型NÜWA：以自然语言创造视觉内容

微软亚洲研究院多模态模型NÜWA：以自然语言创造视觉内容

微软研究院AI头条

0+阅读 · 2022年3月3日

【博士论文】基于深度学习的单目场景深度估计方法研究

【博士论文】基于深度学习的单目场景深度估计方法研究

专知

0+阅读 · 2021年12月8日

【博士论文】视觉语言交互中的视觉推理研究

【博士论文】视觉语言交互中的视觉推理研究

专知

2+阅读 · 2021年12月1日

【博士论文】认知规律启发的显著性物体检测方法与评测

【博士论文】认知规律启发的显著性物体检测方法与评测

专知

4+阅读 · 2021年11月25日

图像描述生成研究进展

图像描述生成研究进展

专知

1+阅读 · 2021年3月29日

基于视觉和语言的跨媒体问答与推理研究综述

基于视觉和语言的跨媒体问答与推理研究综述

专知

5+阅读 · 2021年3月17日

【浙大博士论文】面向复杂场景理解的视觉内容识别、检测与推理方法研究

【浙大博士论文】面向复杂场景理解的视觉内容识别、检测与推理方法研究

专知

26+阅读 · 2020年7月26日

弱监督视觉理解笔记(VALSE2019)

弱监督视觉理解笔记(VALSE2019)

极市平台

27+阅读 · 2019年4月23日

【AIDL专栏】鲁继文：面向视觉内容理解的深度度量学习

【AIDL专栏】鲁继文：面向视觉内容理解的深度度量学习

人工智能前沿讲习班

32+阅读 · 2018年5月22日

相关基金

基于RGB-D数据的个性化手势交互技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

深度学习框架下基于情境线索的视觉注意研究

国家自然科学基金

2+阅读 · 2015年12月31日

基于深度信息和显著计算的手势交互技术研究及应用

国家自然科学基金

1+阅读 · 2014年12月31日

视觉注意机制下基于深度概率图模型的情感计算

国家自然科学基金

2+阅读 · 2013年12月31日

基于视觉的智能机器人场景理解方法研究

国家自然科学基金

1+阅读 · 2013年12月31日

视觉注意模型及其在显著目标检测中的应用研究

国家自然科学基金

3+阅读 · 2013年12月31日

视觉注意的计算模型及其应用

国家自然科学基金

0+阅读 · 2012年12月31日

基于视觉和触觉感知的手势交互及其在运动康复中的应用

国家自然科学基金

2+阅读 · 2012年12月31日

基于多示例学习的视觉注意建模及应用研究

国家自然科学基金

1+阅读 · 2012年12月31日

基于视觉注意机制的多尺度图像融合的研究

国家自然科学基金

1+阅读 · 2009年12月31日

相关论文

Review of Serial and Parallel Min-Cut/Max-Flow Algorithms for Computer Vision

Arxiv

0+阅读 · 2022年4月20日

Vision System of Curling Robots: Thrower and Skip

Arxiv

0+阅读 · 2022年4月20日

Time Domain Adversarial Voice Conversion for ADD 2022

Arxiv

1+阅读 · 2022年4月20日

Heterogeneous Feature Augmentation for Ponzi Detection in Ethereum

Arxiv

0+阅读 · 2022年4月19日

XLM-E: Cross-lingual Language Model Pre-training via ELECTRA

Arxiv

0+阅读 · 2022年4月19日

Non-Parallel Text Style Transfer with Self-Parallel Supervision

Arxiv

0+阅读 · 2022年4月18日

A Survey of Natural Language Generation

Arxiv

15+阅读 · 2021年12月22日

Meta-learning in natural and artificial intelligence

Arxiv

10+阅读 · 2020年11月26日

Image Captioning

Arxiv

11+阅读 · 2018年5月13日

Bottom-Up and Top-Down Attention for Image Captioning and Visual Question Answering

Arxiv

14+阅读 · 2018年3月14日

微信扫码咨询专知VIP会员