项目名称: 人群活动理解中基于时空共现模型的交互动作识别研究

项目编号: No.61305043

项目类型: 青年科学基金项目

立项/批准年度: 2014

项目学科: 自动化技术、计算机技术

项目作者: 姬艳丽

作者单位: 电子科技大学

项目金额: 23万元

中文摘要: 随着多媒体信息智能化发展,以多人参与的群活动为主题的视频理解在视频监控、视频检索和人机交互等领域的需求越来越广泛。而面对群活动中多人交互的复杂场景, 现有的单人活动检测、跟踪、识别等算法已无法满足群活动理解的需要。本项目研究结合人机交互技术通过对复杂的群活动中交互动作进行准确识别,实现对群活动的分析理解。研究内容主要包括:(1)群活动环境下人-人、人-群连接关系分析(Link Analysis)研究,采用视线估计和移动轨迹跟踪等方法,划分交互动作子群;(2)多人交互动作识别算法研究,结合传统识别算法和眼动跟踪等人机交互技术提取交互动作中的关键动作特征,建立时空共现 (Co-occurrence) 模型实现交互动作识别;(3)基于群活动连接关系和交互动作识别结果,实现群活动高层语意理解。本项目成果将促进群活动理解表达、建模及计算模型的发展,并在人机交互、视频监控等方面得到广泛应用。

中文关键词: 交互行为识别;CR-UESTC数据库;人机交互;手势识别;视线估计

英文摘要: With the development of intelligent multimedia,there is a great demand for the understanding of group activities in videos in the field of surveillance,video retrieval and human computer interaction. Facing the complex situation of multi-person interaction, the traditional methods of action detection, human tracking and recognition for single person do not meet the requirments of the recogniton of group activities. In this research, we combine the traditional recognition algorithms and the human computer interaction technology to recognize human interactions exactly for the purpose of complex group activity understanding. Our research contains: (1)The analysis of the relationships of person-to-person, person-to-group in group activities. The attention estimation and human trajectories are used for relationship analysis in group activity, and the results are applied to separate the group to interaction sub-groups. (2)The study on multi-person interaction recognition. The traditional recognition algorithms and the human computer interaction technology are combined to extract efficient action features in interactions, and a Spatio-Temporal Co-Occurrence Model (STCOM) is proposed for interaction recognition. (3) The high level semantic understanding of group activity is realized based on the results of relationship

英文关键词: Interaction recognition;CR-UESTC Dataset;Human-computer interaction;Hand gesture recognition;Eye gazing estimation

成为VIP会员查看完整内容
1

相关内容

【AAAI2022】(2.5+1)D时空场景图用于视频问答
专知会员服务
23+阅读 · 2022年2月21日
【博士论文】视觉语言交互中的视觉推理研究
专知会员服务
61+阅读 · 2021年12月1日
专知会员服务
22+阅读 · 2021年9月23日
专知会员服务
72+阅读 · 2021年4月8日
专知会员服务
55+阅读 · 2021年3月5日
专知会员服务
43+阅读 · 2020年12月8日
基于视觉的三维重建关键技术研究综述
专知会员服务
160+阅读 · 2020年5月1日
【AAAI2022】(2.5+1)D时空场景图用于视频问答
MSRA-万字综述 直击多模态文档理解
夕小瑶的卖萌屋
3+阅读 · 2021年12月28日
CVPR 2020 | 细粒度文本视频跨模态检索
AI科技评论
17+阅读 · 2020年3月24日
大讲堂 | 神经关系抽取模型
AI研习社
24+阅读 · 2018年9月11日
独家 | 光流与行为识别的结合研究
AI科技评论
12+阅读 · 2017年12月29日
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
4+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
1+阅读 · 2009年12月31日
Arxiv
0+阅读 · 2022年4月20日
小贴士
相关VIP内容
【AAAI2022】(2.5+1)D时空场景图用于视频问答
专知会员服务
23+阅读 · 2022年2月21日
【博士论文】视觉语言交互中的视觉推理研究
专知会员服务
61+阅读 · 2021年12月1日
专知会员服务
22+阅读 · 2021年9月23日
专知会员服务
72+阅读 · 2021年4月8日
专知会员服务
55+阅读 · 2021年3月5日
专知会员服务
43+阅读 · 2020年12月8日
基于视觉的三维重建关键技术研究综述
专知会员服务
160+阅读 · 2020年5月1日
相关资讯
【AAAI2022】(2.5+1)D时空场景图用于视频问答
MSRA-万字综述 直击多模态文档理解
夕小瑶的卖萌屋
3+阅读 · 2021年12月28日
CVPR 2020 | 细粒度文本视频跨模态检索
AI科技评论
17+阅读 · 2020年3月24日
大讲堂 | 神经关系抽取模型
AI研习社
24+阅读 · 2018年9月11日
独家 | 光流与行为识别的结合研究
AI科技评论
12+阅读 · 2017年12月29日
相关基金
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
4+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
1+阅读 · 2009年12月31日
微信扫码咨询专知VIP会员