复杂场景视觉注意对象分割方法研究 - 专知基金

会员服务 ·

0

图像处理 · 分割 · 场景分析 ·

2012 年 12 月 31 日

复杂场景视觉注意对象分割方法研究

国家自然科学基金

国家自然科学基金委员会

项目名称： 复杂场景视觉注意对象分割方法研究

项目编号： No.61271289

项目类型： 面上项目

立项/批准年度： 2013

项目学科： 无线电电子学、电信技术

项目作者： 李宏亮

作者单位： 电子科技大学

项目金额： 70万元

中文摘要： 复杂场景分析是智能多媒体信息处理领域中的重要研究课题，而如何建立对象语义模型则是影响场景内容分析的关键因素。本项目针对目前复杂场景语义发现的研究现状，提出了复杂场景的视觉注意对象的表示和分割新方法。由于利用了人的认知心理特性，并把该特性嵌入于高层视觉语义描述中，因此该方法比传统的对象分割方法具有更好的语义特性。通过分析不同视觉特征的显著性表现,建立特征视觉注意度等概念的形式化描述，构建符合视觉认知的局部和全局注意力模型。针对复杂场景对象存在的多样性问题，建立具有视觉注意转移特性的对象描述新方法。并在此基础上，利用空域相关特性，构建潜在注意主题学习模型。建立底层特征到注意对象的多层次表示方法，从而实现复杂场景语义内容的发现与分析。这一研究有望为解决复杂场景内容理解提供新的思路和理论依据。

中文关键词： 图像处理；分割；视觉注意力机制；场景分析；

英文摘要： Complex scene analysis has become an important topic in the field of intelligent multimedia information processing. A key factor in the successful scene content analysis is how to build a semantic model for scene objects. After investigating the current status of semantic discovery in complex scenes, this project proposes a new method to represent and segment visual attention object from complex scenes. Since this method utilizes human cognitive and psychological characteristics that are then embedded in high level semantic descriptions, this method can achieve good semantic description compared with the traditional methods. Four issues will be further studied in this project. The first is to build format descriptions of some concepts such as visual attention degree by analyzing the saliency of visual features. The second aims to propose local and global attention models that tally with the human perception. For the diversity issue in complex scene object recognition, the third task is designed to find a new method to describe visual attention objects based on attention transfer mechanism and build a perceptual topic model. Finally, we perform semantic content discovery and analysis for complex scene by the multi-level description from low-level features to object and event. This work will provide a new idea and

英文关键词： Image processing；segmentation；visual attention；scene analysis；

成为VIP会员查看完整内容

1

相关内容

图像处理

图像处理(image processing)，用计算机对图像进行分析，以达到所需结果的技术。又称影像处理。图像处理一般指数字图像处理。数字图像是指用工业相机、摄像机、扫描仪等设备经过拍摄得到的一个大的二维数组，该数组的元素称为像素，其值称为灰度值。

【CVPR2022】整合少样本学习的分类和分割

【CVPR2022】整合少样本学习的分类和分割

专知会员服务

28+阅读 · 2022年3月31日

【CVPR2022】语言引导与基于视觉的深度度量学习的集成

【CVPR2022】语言引导与基于视觉的深度度量学习的集成

专知会员服务

17+阅读 · 2022年3月17日

【博士论文】视觉语言交互中的视觉推理研究

【博士论文】视觉语言交互中的视觉推理研究

专知会员服务

64+阅读 · 2021年12月1日

三维视觉前沿进展

专知会员服务

67+阅读 · 2021年5月21日

CVPR 2021 Oral | 室内动态场景中的相机重定位

CVPR 2021 Oral | 室内动态场景中的相机重定位

专知会员服务

16+阅读 · 2021年4月12日

图像描述生成研究进展

专知会员服务

70+阅读 · 2021年3月29日

【博士论文】复杂场景中的人群行为解析及其应用

专知会员服务

46+阅读 · 2020年12月8日

中科院计算所刘昊淼博士论文《面向物体语义理解的视觉表示学习》

中科院计算所刘昊淼博士论文《面向物体语义理解的视觉表示学习》

专知会员服务

44+阅读 · 2020年12月4日

【浙大博士论文】面向复杂场景理解的视觉内容识别、检测与推理方法研究

【浙大博士论文】面向复杂场景理解的视觉内容识别、检测与推理方法研究

专知会员服务

147+阅读 · 2020年7月26日

【CVPR2020-中科院计算所】多模态GNN：在视觉信息和场景文字上联合推理

【CVPR2020-中科院计算所】多模态GNN：在视觉信息和场景文字上联合推理

专知会员服务

61+阅读 · 2020年4月7日

【CVPR2022】整合少样本学习的分类和分割

【CVPR2022】整合少样本学习的分类和分割

专知

2+阅读 · 2022年3月31日

首个视觉-语言预训练综述来了！

首个视觉-语言预训练综述来了！

夕小瑶的卖萌屋

8+阅读 · 2022年3月29日

【CVPR2022】语言引导与基于视觉的深度度量学习的集成

【CVPR2022】语言引导与基于视觉的深度度量学习的集成

专知

3+阅读 · 2022年3月17日

【博士论文】基于深度学习的单目场景深度估计方法研究

【博士论文】基于深度学习的单目场景深度估计方法研究

专知

0+阅读 · 2021年12月8日

【博士论文】视觉语言交互中的视觉推理研究

【博士论文】视觉语言交互中的视觉推理研究

专知

2+阅读 · 2021年12月1日

NeurIPS 2021 | 物体检测与分割的零标签视觉学习

NeurIPS 2021 | 物体检测与分割的零标签视觉学习

微软研究院AI头条

0+阅读 · 2021年12月1日

图像描述生成研究进展

图像描述生成研究进展

专知

1+阅读 · 2021年3月29日

【浙大博士论文】面向复杂场景理解的视觉内容识别、检测与推理方法研究

【浙大博士论文】面向复杂场景理解的视觉内容识别、检测与推理方法研究

专知

26+阅读 · 2020年7月26日

CVPR 2018 | 使用CNN生成图像先验，实现更广泛场景的盲图像去模糊

CVPR 2018 | 使用CNN生成图像先验，实现更广泛场景的盲图像去模糊

极市平台

14+阅读 · 2018年3月21日

【干货】基于属性学习和额外知识库的图像描述生成和视觉问答

【干货】基于属性学习和额外知识库的图像描述生成和视觉问答

专知

18+阅读 · 2017年12月25日

基于超图的三维模型检索方法研究

国家自然科学基金

6+阅读 · 2015年12月31日

基于视觉上下文与文字显著性的复杂自然场景中文字检测研究

国家自然科学基金

1+阅读 · 2015年12月31日

面向移动机器人语义对象的协同感知注意机制及分割方法研究

国家自然科学基金

0+阅读 · 2013年12月31日

仿视觉感知机制的图像场景语义分类研究

国家自然科学基金

1+阅读 · 2013年12月31日

基于视觉注意和稀疏表示的行人检测与跟踪方法研究

国家自然科学基金

3+阅读 · 2013年12月31日

视觉注意与人脑记忆机制启发下的感兴趣目标提取与跟踪

国家自然科学基金

1+阅读 · 2012年12月31日

基于流形和视觉注意的复杂场景夜视目标识别

国家自然科学基金

0+阅读 · 2012年12月31日

融合多视觉对象的行为分析与语义描述

国家自然科学基金

1+阅读 · 2012年12月31日

基于多示例学习的视觉注意建模及应用研究

国家自然科学基金

1+阅读 · 2012年12月31日

基于感知视觉单词描述的对象分割研究

国家自然科学基金

0+阅读 · 2009年12月31日

Multi-View Spatial-Temporal Network for Continuous Sign Language Recognition

Arxiv

0+阅读 · 2022年4月19日

Joint Multi-view Unsupervised Feature Selection and Graph Learning

Arxiv

0+阅读 · 2022年4月18日

Transformers in Medical Image Analysis: A Review

Transformers in Medical Image Analysis: A Review

Arxiv

40+阅读 · 2022年2月24日

A Survey on Deep Reinforcement Learning for Data Processing and Analytics

Arxiv

24+阅读 · 2022年2月4日

A Survey on Multi-Task Learning

Arxiv

31+阅读 · 2021年3月29日

Deep Learning for Learning Graph Representations

Arxiv

35+阅读 · 2020年1月2日

A Survey of the Usages of Deep Learning in Natural Language Processing

A Survey of the Usages of Deep Learning in Natural Language Processing

Arxiv

122+阅读 · 2019年9月11日

Graph Neural Networks: A Review of Methods and Applications

Graph Neural Networks: A Review of Methods and Applications

Arxiv

75+阅读 · 2018年12月20日

Notes on Deep Learning for NLP

Arxiv

22+阅读 · 2018年8月30日

Deep Reinforcement Learning: An Overview

Arxiv

15+阅读 · 2018年6月23日

阅读: 0 点赞: 0

小贴士

登录享主题订阅及个性化推荐

相关主题

热门VIP内容

开通专知VIP会员享更多权益服务

扩散语言模型综述

《美陆军徒步机动作战条令手册》最新168页

【博士论文】理解神经网络的训练动态：从局部优化轨迹与特征学习视角

军事后勤数字化未来展望

相关VIP内容

【CVPR2022】整合少样本学习的分类和分割

【CVPR2022】整合少样本学习的分类和分割

专知会员服务

28+阅读 · 2022年3月31日

【CVPR2022】语言引导与基于视觉的深度度量学习的集成

【CVPR2022】语言引导与基于视觉的深度度量学习的集成

专知会员服务

17+阅读 · 2022年3月17日

【博士论文】视觉语言交互中的视觉推理研究

【博士论文】视觉语言交互中的视觉推理研究

专知会员服务

64+阅读 · 2021年12月1日

三维视觉前沿进展

专知会员服务

67+阅读 · 2021年5月21日

CVPR 2021 Oral | 室内动态场景中的相机重定位

CVPR 2021 Oral | 室内动态场景中的相机重定位

专知会员服务

16+阅读 · 2021年4月12日

图像描述生成研究进展

专知会员服务

70+阅读 · 2021年3月29日

【博士论文】复杂场景中的人群行为解析及其应用

专知会员服务

46+阅读 · 2020年12月8日

中科院计算所刘昊淼博士论文《面向物体语义理解的视觉表示学习》

中科院计算所刘昊淼博士论文《面向物体语义理解的视觉表示学习》

专知会员服务

44+阅读 · 2020年12月4日

【浙大博士论文】面向复杂场景理解的视觉内容识别、检测与推理方法研究

【浙大博士论文】面向复杂场景理解的视觉内容识别、检测与推理方法研究

专知会员服务

147+阅读 · 2020年7月26日

【CVPR2020-中科院计算所】多模态GNN：在视觉信息和场景文字上联合推理

【CVPR2020-中科院计算所】多模态GNN：在视觉信息和场景文字上联合推理

专知会员服务

61+阅读 · 2020年4月7日

相关资讯

【CVPR2022】整合少样本学习的分类和分割

【CVPR2022】整合少样本学习的分类和分割

专知

2+阅读 · 2022年3月31日

首个视觉-语言预训练综述来了！

首个视觉-语言预训练综述来了！

夕小瑶的卖萌屋

8+阅读 · 2022年3月29日

【CVPR2022】语言引导与基于视觉的深度度量学习的集成

【CVPR2022】语言引导与基于视觉的深度度量学习的集成

专知

3+阅读 · 2022年3月17日

【博士论文】基于深度学习的单目场景深度估计方法研究

【博士论文】基于深度学习的单目场景深度估计方法研究

专知

0+阅读 · 2021年12月8日

【博士论文】视觉语言交互中的视觉推理研究

【博士论文】视觉语言交互中的视觉推理研究

专知

2+阅读 · 2021年12月1日

NeurIPS 2021 | 物体检测与分割的零标签视觉学习

NeurIPS 2021 | 物体检测与分割的零标签视觉学习

微软研究院AI头条

0+阅读 · 2021年12月1日

图像描述生成研究进展

图像描述生成研究进展

专知

1+阅读 · 2021年3月29日

【浙大博士论文】面向复杂场景理解的视觉内容识别、检测与推理方法研究

【浙大博士论文】面向复杂场景理解的视觉内容识别、检测与推理方法研究

专知

26+阅读 · 2020年7月26日

CVPR 2018 | 使用CNN生成图像先验，实现更广泛场景的盲图像去模糊

CVPR 2018 | 使用CNN生成图像先验，实现更广泛场景的盲图像去模糊

极市平台

14+阅读 · 2018年3月21日

【干货】基于属性学习和额外知识库的图像描述生成和视觉问答

【干货】基于属性学习和额外知识库的图像描述生成和视觉问答

专知

18+阅读 · 2017年12月25日

相关基金

基于超图的三维模型检索方法研究

国家自然科学基金

6+阅读 · 2015年12月31日

基于视觉上下文与文字显著性的复杂自然场景中文字检测研究

国家自然科学基金

1+阅读 · 2015年12月31日

面向移动机器人语义对象的协同感知注意机制及分割方法研究

国家自然科学基金

0+阅读 · 2013年12月31日

仿视觉感知机制的图像场景语义分类研究

国家自然科学基金

1+阅读 · 2013年12月31日

基于视觉注意和稀疏表示的行人检测与跟踪方法研究

国家自然科学基金

3+阅读 · 2013年12月31日

视觉注意与人脑记忆机制启发下的感兴趣目标提取与跟踪

国家自然科学基金

1+阅读 · 2012年12月31日

基于流形和视觉注意的复杂场景夜视目标识别

国家自然科学基金

0+阅读 · 2012年12月31日

融合多视觉对象的行为分析与语义描述

国家自然科学基金

1+阅读 · 2012年12月31日

基于多示例学习的视觉注意建模及应用研究

国家自然科学基金

1+阅读 · 2012年12月31日

基于感知视觉单词描述的对象分割研究

国家自然科学基金

0+阅读 · 2009年12月31日

相关论文

Multi-View Spatial-Temporal Network for Continuous Sign Language Recognition

Arxiv

0+阅读 · 2022年4月19日

Joint Multi-view Unsupervised Feature Selection and Graph Learning

Arxiv

0+阅读 · 2022年4月18日

Transformers in Medical Image Analysis: A Review

Transformers in Medical Image Analysis: A Review

Arxiv

40+阅读 · 2022年2月24日

A Survey on Deep Reinforcement Learning for Data Processing and Analytics

Arxiv

24+阅读 · 2022年2月4日

A Survey on Multi-Task Learning

Arxiv

31+阅读 · 2021年3月29日

Deep Learning for Learning Graph Representations

Arxiv

35+阅读 · 2020年1月2日

A Survey of the Usages of Deep Learning in Natural Language Processing

A Survey of the Usages of Deep Learning in Natural Language Processing

Arxiv

122+阅读 · 2019年9月11日

Graph Neural Networks: A Review of Methods and Applications

Graph Neural Networks: A Review of Methods and Applications

Arxiv

75+阅读 · 2018年12月20日

Notes on Deep Learning for NLP

Arxiv

22+阅读 · 2018年8月30日

Deep Reinforcement Learning: An Overview

Arxiv

15+阅读 · 2018年6月23日

微信扫码咨询专知VIP会员