选择性注意驱动的图像语义理解方法与计算模型研究 - 专知基金

会员服务 ·

0

图像理解 · 选择性注意 · 视觉指纹 · 语义分析 ·

2008 年 12 月 31 日

选择性注意驱动的图像语义理解方法与计算模型研究

国家自然科学基金

国家自然科学基金委员会

项目名称： 选择性注意驱动的图像语义理解方法与计算模型研究

项目编号： No.90820003

项目类型： 专项基金项目

立项/批准年度： 2009

项目学科： 金属学与金属工艺

项目作者： 黄铁军

作者单位： 北京大学

项目金额： 50万元

中文摘要： 借鉴人类视觉系统中稀疏编码、成组编码、选择性注意等生理心理机制，提出并研究一种新的图像语义表示和计算模型，该模型以视觉特征相对稳定且与客观事物具有明确映射关系视觉单元(Visual Units)为语义表示、分析的核心，通过对规模化的图像和关联信息的非监督学习实现对图像的语义分析与理解。在图像不变特征提取、图像基元提取、要素图生成等图像处理和计算机视觉已有成果基础上，研究利用选择性注意模型，实现视觉单元的自动抽取，利用视纹实现视觉单元的比对和识别，采用优化学习的方法自动构建视觉单元词典，用内容关联分析方法实现图像和视觉单元的自动文本标注，从而建立一套较为完整的图像语义理解计算模型、方法和技术体系，在特定场景监控图像的自动解释与索引系统、海量互联网图像语义分析与标注两个方面进行实验验证。

中文关键词： 图像理解;选择性注意;视觉单元;视觉指纹;语义分析

英文摘要： According to physiological and psychological mechanisms such as sparse coding, group coding and selective attention of human vision system (HVS), the project proposes and studies a new image semantic representation and computing model. By employing visual unit which has stable visual features and can be mapped to objects in physical world directly as the core for semantic representation, image understanding will be carried out by unsupervised learning on the relationship and associated data of amount of images. Based on previous work on image processing and computer vision such as extraction of the variant features, visual primitives and primal sketch, visual units are extracted under selective attention model and compared and identified by visual fingerprinting technology. Then, a visual unit dictionary is generated from the visual units above extracted with textual description being annotating automatically by relational analysis of images and their surrounding texts. As a result, a set of models, approaches and technologies of image semantic understanding will be established and will be tested in two experiments: the surveillance scene automatic interpreting and indexing and the Internet image semantic analysis and annotation.

英文关键词： Image understanding;Selective attention;Visual unit;Visual fingerprinting;Semantic analysis

成为VIP会员查看完整内容

0

相关内容

图像理解

混合增强视觉认知架构及其关键技术进展

混合增强视觉认知架构及其关键技术进展

专知会员服务

45+阅读 · 2021年11月20日

【ICCV2021】多视角多尺度监督的图像篡改检测模型

专知会员服务

23+阅读 · 2021年9月23日

【伯克利博士论文】面向深度图像合成的机器学习，155页pdf

【伯克利博士论文】面向深度图像合成的机器学习，155页pdf

专知会员服务

35+阅读 · 2021年5月26日

图像描述生成研究进展

专知会员服务

71+阅读 · 2021年3月29日

深度卷积神经网络图像语义分割研究进展

专知会员服务

87+阅读 · 2021年1月7日

【ACM MM2020-计算所】基于多源语义嵌入的场景识别的广义零样本学习

【ACM MM2020-计算所】基于多源语义嵌入的场景识别的广义零样本学习

专知会员服务

22+阅读 · 2020年9月5日

【ECCV2020】基于场景图分解的自然语言描述生成

【ECCV2020】基于场景图分解的自然语言描述生成

专知会员服务

24+阅读 · 2020年9月3日

【浙大博士论文】面向复杂场景理解的视觉内容识别、检测与推理方法研究

【浙大博士论文】面向复杂场景理解的视觉内容识别、检测与推理方法研究

专知会员服务

147+阅读 · 2020年7月26日

【北京大学】探索提取跨模态信息进行图像caption，Exploring and Distilling Cross-Modal Information for Image Captioning

【北京大学】探索提取跨模态信息进行图像caption，Exploring and Distilling Cross-Modal Information for Image Captioning

专知会员服务

54+阅读 · 2020年3月3日

图像内容自动描述技术综述

图像内容自动描述技术综述

专知会员服务

88+阅读 · 2019年11月17日

用图像混合学习更细粒度的特征表示，CMU邢波团队新论文入选AAAI 2022

用图像混合学习更细粒度的特征表示，CMU邢波团队新论文入选AAAI 2022

机器之心

0+阅读 · 2022年1月5日

论文浅尝 | 面向视觉常识推理的层次语义增强方向图网络

论文浅尝 | 面向视觉常识推理的层次语义增强方向图网络

开放知识图谱

0+阅读 · 2021年12月11日

图像描述生成研究进展

图像描述生成研究进展

专知

1+阅读 · 2021年3月29日

【学界】CVPR 2019 | 基于级联语义引导下的多通道注意力选择图像翻译

【学界】CVPR 2019 | 基于级联语义引导下的多通道注意力选择图像翻译

GAN生成式对抗网络

10+阅读 · 2019年8月17日

弱监督视觉理解笔记(VALSE2019)

弱监督视觉理解笔记(VALSE2019)

极市平台

27+阅读 · 2019年4月23日

【学科发展报告】计算机视觉

【学科发展报告】计算机视觉

中国自动化学会

43+阅读 · 2018年10月12日

一文读懂图像压缩算法

一文读懂图像压缩算法

七月在线实验室

17+阅读 · 2018年5月2日

图像检索研究进展：浅层、深层特征及特征融合

图像检索研究进展：浅层、深层特征及特征融合

中国计算机学会

122+阅读 · 2018年3月26日

【机器视觉】计算机视觉简介：历史、现状和发展趋势

【机器视觉】计算机视觉简介：历史、现状和发展趋势

产业智能官

13+阅读 · 2017年11月25日

计算机视觉简介：历史、现状和发展趋势

计算机视觉简介：历史、现状和发展趋势

机器学习研究会

21+阅读 · 2017年11月21日

仿视觉感知机制的图像场景语义分类研究

国家自然科学基金

1+阅读 · 2013年12月31日

基于社会网络的图像语义特征提取与描述方法研究

国家自然科学基金

0+阅读 · 2012年12月31日

自然视觉的选择性注意在计算机视觉中的实现

国家自然科学基金

1+阅读 · 2012年12月31日

基于多示例学习的视觉注意建模及应用研究

国家自然科学基金

1+阅读 · 2012年12月31日

基于贝叶斯推理的视觉注意计算模型及应用研究

国家自然科学基金

0+阅读 · 2011年12月31日

基于视觉显著性的图像内容分析与检索

国家自然科学基金

0+阅读 · 2011年12月31日

基于生物视觉机制的语义图像检索模型及方法

国家自然科学基金

0+阅读 · 2009年12月31日

视频选择性注意机理与语义特征提取

国家自然科学基金

1+阅读 · 2009年12月31日

基于选择性注意模型的可视媒体文本检测方法研究

国家自然科学基金

0+阅读 · 2009年12月31日

基于视觉注意机制的多尺度图像融合的研究

国家自然科学基金

1+阅读 · 2009年12月31日

Simple and Effective Unsupervised Speech Synthesis

Simple and Effective Unsupervised Speech Synthesis

Arxiv

2+阅读 · 2022年4月20日

Effects of Graph Convolutions in Deep Networks

Arxiv

0+阅读 · 2022年4月20日

Counting and enumerating optimum cut sets for hypergraph $k$-partitioning problems for fixed $k$

Arxiv

0+阅读 · 2022年4月20日

Cross-Modal Coherence for Text-to-Image Retrieval

Arxiv

0+阅读 · 2022年4月15日

Pre-training Methods in Information Retrieval

Arxiv

1+阅读 · 2022年4月15日

Simple but Effective: CLIP Embeddings for Embodied AI

Arxiv

1+阅读 · 2022年4月15日

Meta-learning in natural and artificial intelligence

Arxiv

10+阅读 · 2020年11月26日

Pretrained Transformers for Text Ranking: BERT and Beyond

Arxiv

28+阅读 · 2020年10月13日

Mining Disinformation and Fake News: Concepts, Methods, and Recent Advancements

Mining Disinformation and Fake News: Concepts, Methods, and Recent Advancements

Arxiv

16+阅读 · 2020年1月2日

Strong Baselines for Simple Question Answering over Knowledge Graphs with and without Neural Networks

Arxiv

17+阅读 · 2018年6月5日

阅读: 0 点赞: 0

小贴士

登录享主题订阅及个性化推荐

相关主题

选择性注意

热门VIP内容

开通专知VIP会员享更多权益服务

用于无人机的C波段空地通信系统研究 | 2025最新116页

甚高频军事战术通信系统传播性能分析研究

军事通信系统：安全行动的支柱

卫星与地面通信系统：美陆军面临的空间与电子战局势 | 39页报告

相关VIP内容

混合增强视觉认知架构及其关键技术进展

混合增强视觉认知架构及其关键技术进展

专知会员服务

45+阅读 · 2021年11月20日

【ICCV2021】多视角多尺度监督的图像篡改检测模型

专知会员服务

23+阅读 · 2021年9月23日

【伯克利博士论文】面向深度图像合成的机器学习，155页pdf

【伯克利博士论文】面向深度图像合成的机器学习，155页pdf

专知会员服务

35+阅读 · 2021年5月26日

图像描述生成研究进展

专知会员服务

71+阅读 · 2021年3月29日

深度卷积神经网络图像语义分割研究进展

专知会员服务

87+阅读 · 2021年1月7日

【ACM MM2020-计算所】基于多源语义嵌入的场景识别的广义零样本学习

【ACM MM2020-计算所】基于多源语义嵌入的场景识别的广义零样本学习

专知会员服务

22+阅读 · 2020年9月5日

【ECCV2020】基于场景图分解的自然语言描述生成

【ECCV2020】基于场景图分解的自然语言描述生成

专知会员服务

24+阅读 · 2020年9月3日

【浙大博士论文】面向复杂场景理解的视觉内容识别、检测与推理方法研究

【浙大博士论文】面向复杂场景理解的视觉内容识别、检测与推理方法研究

专知会员服务

147+阅读 · 2020年7月26日

【北京大学】探索提取跨模态信息进行图像caption，Exploring and Distilling Cross-Modal Information for Image Captioning

【北京大学】探索提取跨模态信息进行图像caption，Exploring and Distilling Cross-Modal Information for Image Captioning

专知会员服务

54+阅读 · 2020年3月3日

图像内容自动描述技术综述

图像内容自动描述技术综述

专知会员服务

88+阅读 · 2019年11月17日

相关资讯

用图像混合学习更细粒度的特征表示，CMU邢波团队新论文入选AAAI 2022

用图像混合学习更细粒度的特征表示，CMU邢波团队新论文入选AAAI 2022

机器之心

0+阅读 · 2022年1月5日

论文浅尝 | 面向视觉常识推理的层次语义增强方向图网络

论文浅尝 | 面向视觉常识推理的层次语义增强方向图网络

开放知识图谱

0+阅读 · 2021年12月11日

图像描述生成研究进展

图像描述生成研究进展

专知

1+阅读 · 2021年3月29日

【学界】CVPR 2019 | 基于级联语义引导下的多通道注意力选择图像翻译

【学界】CVPR 2019 | 基于级联语义引导下的多通道注意力选择图像翻译

GAN生成式对抗网络

10+阅读 · 2019年8月17日

弱监督视觉理解笔记(VALSE2019)

弱监督视觉理解笔记(VALSE2019)

极市平台

27+阅读 · 2019年4月23日

【学科发展报告】计算机视觉

【学科发展报告】计算机视觉

中国自动化学会

43+阅读 · 2018年10月12日

一文读懂图像压缩算法

一文读懂图像压缩算法

七月在线实验室

17+阅读 · 2018年5月2日

图像检索研究进展：浅层、深层特征及特征融合

图像检索研究进展：浅层、深层特征及特征融合

中国计算机学会

122+阅读 · 2018年3月26日

【机器视觉】计算机视觉简介：历史、现状和发展趋势

【机器视觉】计算机视觉简介：历史、现状和发展趋势

产业智能官

13+阅读 · 2017年11月25日

计算机视觉简介：历史、现状和发展趋势

计算机视觉简介：历史、现状和发展趋势

机器学习研究会

21+阅读 · 2017年11月21日

相关基金

仿视觉感知机制的图像场景语义分类研究

国家自然科学基金

1+阅读 · 2013年12月31日

基于社会网络的图像语义特征提取与描述方法研究

国家自然科学基金

0+阅读 · 2012年12月31日

自然视觉的选择性注意在计算机视觉中的实现

国家自然科学基金

1+阅读 · 2012年12月31日

基于多示例学习的视觉注意建模及应用研究

国家自然科学基金

1+阅读 · 2012年12月31日

基于贝叶斯推理的视觉注意计算模型及应用研究

国家自然科学基金

0+阅读 · 2011年12月31日

基于视觉显著性的图像内容分析与检索

国家自然科学基金

0+阅读 · 2011年12月31日

基于生物视觉机制的语义图像检索模型及方法

国家自然科学基金

0+阅读 · 2009年12月31日

视频选择性注意机理与语义特征提取

国家自然科学基金

1+阅读 · 2009年12月31日

基于选择性注意模型的可视媒体文本检测方法研究

国家自然科学基金

0+阅读 · 2009年12月31日

基于视觉注意机制的多尺度图像融合的研究

国家自然科学基金

1+阅读 · 2009年12月31日

相关论文

Simple and Effective Unsupervised Speech Synthesis

Simple and Effective Unsupervised Speech Synthesis

Arxiv

2+阅读 · 2022年4月20日

Effects of Graph Convolutions in Deep Networks

Arxiv

0+阅读 · 2022年4月20日

Counting and enumerating optimum cut sets for hypergraph $k$-partitioning problems for fixed $k$

Arxiv

0+阅读 · 2022年4月20日

Cross-Modal Coherence for Text-to-Image Retrieval

Arxiv

0+阅读 · 2022年4月15日

Pre-training Methods in Information Retrieval

Arxiv

1+阅读 · 2022年4月15日

Simple but Effective: CLIP Embeddings for Embodied AI

Arxiv

1+阅读 · 2022年4月15日

Meta-learning in natural and artificial intelligence

Arxiv

10+阅读 · 2020年11月26日

Pretrained Transformers for Text Ranking: BERT and Beyond

Arxiv

28+阅读 · 2020年10月13日

Mining Disinformation and Fake News: Concepts, Methods, and Recent Advancements

Mining Disinformation and Fake News: Concepts, Methods, and Recent Advancements

Arxiv

16+阅读 · 2020年1月2日

Strong Baselines for Simple Question Answering over Knowledge Graphs with and without Neural Networks

Arxiv

17+阅读 · 2018年6月5日

微信扫码咨询专知VIP会员