项目名称: 视频中事件的内容分析与语义描述

项目编号: No.61472038

项目类型: 面上项目

立项/批准年度: 2015

项目学科: 其他

项目作者: 裴明涛

作者单位: 北京理工大学

项目金额: 80万元

中文摘要: 视频中事件的内容分析与语义描述是视频理解的核心内容,在智能视频监控、智能视频检索等领域有着广泛的应用前景。目前大部分的工作主要集中在持续时间较短、变化较少的事件识别,对持续时间较长、变化复杂的事件识别研究较少。本项目主要研究视频中复杂事件的内容分析与语义描述,建立在底层视觉模式、中层原子事件、高层事件语义等多个层次进行分析的计算方法,以获取发生了什么事件、事件分为几个阶段、每个阶段分别出现了什么行为的语义描述。研究内容包括:视频特征生成式表示与建模的理论和方法,分析视频中的基本视觉特征:结构基元和纹理基元;完备的原子事件集合的生成方法,并基于原子事件集合对视频中的原子事件类别进行标注;将原子事件的时序分割与整体事件的语义描述联合建模,得到统一的计算模型,进而建立高层语义的推理算法。

中文关键词: 视频理解;语义描述;内容分析;视觉特征

英文摘要: Content analysis and semantic description of events from videos has wide applications on many fields such as intelligent video surveillance and video content retrieval. Most existing methods focus on relative simple events with short continuing time and simple movements, and very few of works are done on the analysis and description of long-time complex events with many complex motions and actions in videos. With the aim of inferring the what of event, which of atomic events, and when of atomic events semantic description, this proposal proposes a novel framework for analyzing video events which combines multiple computational levels such as low-level video primitive feature、mid-level atomic event and high-level event semantic description. Under this framework, we first investigate a common generative model to describe the two types of video primitives in a unified form: structural video primitives and textural video primitives. Then we exploit the automatic generation of a complete set of mid-level atomic events, and also focus on the automatic atomic event annotation of a large number of event videos. Finally, we will introduce a unified discriminative framework to jointly model the temporal segmentation of atomic events and semantic description of the overall event. This proposal poses significant importance on proposing new theroies and methodologies on video event analysis and also beneficial for developing more technologies and methods for wide applications of event analysis.

英文关键词: video understanding;semantic description;content analysis;visual feature

成为VIP会员查看完整内容
1

相关内容

从视频到语言: 视频标题生成与描述研究综述
专知会员服务
19+阅读 · 2022年1月8日
专知会员服务
12+阅读 · 2021年9月13日
专知会员服务
37+阅读 · 2021年5月29日
专知会员服务
69+阅读 · 2021年3月29日
专知会员服务
14+阅读 · 2021年3月26日
商业数据分析,39页ppt
专知会员服务
160+阅读 · 2020年6月2日
 图像内容自动描述技术综述
专知会员服务
86+阅读 · 2019年11月17日
图像描述生成研究进展
专知
1+阅读 · 2021年3月29日
CVPR 2020 | 细粒度文本视频跨模态检索
AI科技评论
17+阅读 · 2020年3月24日
论文浅尝 | 时序与因果关系联合推理
开放知识图谱
35+阅读 · 2019年6月23日
SLAM的动态地图和语义问题
计算机视觉life
24+阅读 · 2019年4月27日
综述 | 事件抽取及推理 (下)
开放知识图谱
38+阅读 · 2019年1月14日
视频中的多目标跟踪【附PPT与视频资料】
人工智能前沿讲习班
30+阅读 · 2018年11月29日
特征工程的特征理解(一)
机器学习研究会
10+阅读 · 2017年10月23日
基于图片内容的深度学习图片检索(一)
七月在线实验室
20+阅读 · 2017年10月1日
国家自然科学基金
12+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
1+阅读 · 2008年12月31日
Arxiv
33+阅读 · 2022年2月15日
Arxiv
14+阅读 · 2021年3月10日
Arxiv
38+阅读 · 2020年12月2日
小贴士
相关VIP内容
从视频到语言: 视频标题生成与描述研究综述
专知会员服务
19+阅读 · 2022年1月8日
专知会员服务
12+阅读 · 2021年9月13日
专知会员服务
37+阅读 · 2021年5月29日
专知会员服务
69+阅读 · 2021年3月29日
专知会员服务
14+阅读 · 2021年3月26日
商业数据分析,39页ppt
专知会员服务
160+阅读 · 2020年6月2日
 图像内容自动描述技术综述
专知会员服务
86+阅读 · 2019年11月17日
相关资讯
图像描述生成研究进展
专知
1+阅读 · 2021年3月29日
CVPR 2020 | 细粒度文本视频跨模态检索
AI科技评论
17+阅读 · 2020年3月24日
论文浅尝 | 时序与因果关系联合推理
开放知识图谱
35+阅读 · 2019年6月23日
SLAM的动态地图和语义问题
计算机视觉life
24+阅读 · 2019年4月27日
综述 | 事件抽取及推理 (下)
开放知识图谱
38+阅读 · 2019年1月14日
视频中的多目标跟踪【附PPT与视频资料】
人工智能前沿讲习班
30+阅读 · 2018年11月29日
特征工程的特征理解(一)
机器学习研究会
10+阅读 · 2017年10月23日
基于图片内容的深度学习图片检索(一)
七月在线实验室
20+阅读 · 2017年10月1日
相关基金
国家自然科学基金
12+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
1+阅读 · 2008年12月31日
微信扫码咨询专知VIP会员