【博士论文】认知规律启发的显著性物体检测方法与评测 - 专知

会员服务 ·

0

【博士论文】认知规律启发的显著性物体检测方法与评测

2021 年 11 月 25 日 专知

来自南开大学范登平的博士论文，入选2021年度“CCF优秀博士学位论文奖”初评名单！

https://www.ccf.org.cn/Focus/2021-11-22/750448.shtml

认知规律启发的显著性物体检测方法与评测

显著性物体检测技术起源于认知学中人类的视觉注意行为，即人类视觉系统能够快速地将注意力转移到视觉场景中最具信息量的区域而有选择性地忽略其它区域。该技术在现实生活中有着广泛的应用基础，如，自动驾驶、人机互动、视频分割、视频字幕、视频压缩等。除了其学术价值和实际意义之外，由于图像和视频数据（遮挡、模糊、运动模式等）自身的挑战以及人类在动态场景中注意行为（选择性注意分配和注意转移）固有的复杂性，使得显著性物体检测技术面临着巨大挑战。受制于采集设备，早期构建的显著性物体检测数据集表达真实场景的能力非常有限。同时，这一领域的评价指标也是基于像素级误差的, 完全忽略了人类认知规律的特性。上述问题，严重制约了显著性物体检测技术的发展。

本文围绕图像视频显著性物体检测，研究了基于人类认知规律的数据集建立、模型建模、评价指标三个方向的问题。 主要创新点包括：

1. 针对现有图像显著性物体检测公开测试存在的各种偏差问题，构建了一个富上下文环境下的图像显著性物体检测数据集 SOC，并首次从属性层面对现有方法进行了大量评测和深入的分析。

2. 针对视频显著性物体检测中注意力转移的问题，构建了第一个高质量、稠密标注的视频显著性物体检测 DAVSOD 数据集；提出了基于注意力转移的 SSAV 模型，取得了国际领先的检测性能；提供了当前最大规模、最完整的视频显著性物体评测结果。

3. 针对非二进制显著性物体检测质量评价的问题，提出了符合人类认知规律的度量指标 S-measure，使得评价方法从像素 -级过度到结构 -级，特别是与人的主观评价一致性性能从低于 50% 提升到了 77%。

4. 针对二进制显著性物体检测质量评价的问题，提出了符合人类认知规律的度量指标 E-measure，使得评价方法在一个紧凑项中同时考虑了全局和局部信息，上述方法相比国际最先进算法的性能提高了 19%。

专知便捷查看

便捷下载，请关注专知公众号（点击上方蓝色专知关注）

后台回复“CSOD” 就可以获取《【博士论文】认知规律启发的显著性物体检测方法与评测》专知下载链接

专知，专业可信的人工智能知识分发 ，让认知协作更快更好！欢迎注册登录专知www.zhuanzhi.ai，获取5000+AI主题干货知识资料！

欢迎微信扫一扫加入专知人工智能知识星球群，获取最新AI专业干货知识教程资料和与专家交流咨询！

点击“ 阅读原文 ”，了解使用专知 ，查看获取5000+AI主题知识资源

登录查看更多

4

相关内容

显著性物体检测

显著性物体检测

【博士论文】开放环境下的度量学习研究

【博士论文】开放环境下的度量学习研究

专知会员服务

49+阅读 · 2021年12月4日

【博士论文】视觉语言交互中的视觉推理研究

【博士论文】视觉语言交互中的视觉推理研究

专知会员服务

65+阅读 · 2021年12月1日

南开大学范登平的博士论文《认知规律启发的显著性物体检测方法与评测》

南开大学范登平的博士论文《认知规律启发的显著性物体检测方法与评测》

专知会员服务

23+阅读 · 2021年11月25日

基于深度学习的通用目标检测研究综述

专知会员服务

93+阅读 · 2021年8月29日

【ACL2021】基于图表示的多元关系链接预测

专知会员服务

34+阅读 · 2021年8月9日

【CVPR2021】双图层实例分割，大幅提升遮挡处理性能

专知会员服务

18+阅读 · 2021年5月23日

【AAAI2021】学习场景图之间的相似度实现图像到图像的检索

【AAAI2021】学习场景图之间的相似度实现图像到图像的检索

专知会员服务

38+阅读 · 2021年1月3日

【博士论文】多层图分析技术研究

专知会员服务

38+阅读 · 2020年12月22日

【浙大博士论文】面向复杂场景理解的视觉内容识别、检测与推理方法研究

【浙大博士论文】面向复杂场景理解的视觉内容识别、检测与推理方法研究

专知会员服务

147+阅读 · 2020年7月26日

【CVPR2020-北京大学】自适应间隔损失的提升小样本学习

【CVPR2020-北京大学】自适应间隔损失的提升小样本学习

专知会员服务

85+阅读 · 2020年6月9日

文本情感分析方法研究综述

文本情感分析方法研究综述

专知

4+阅读 · 2021年4月20日

【博士论文】面向物体语义理解的视觉表示学习

【博士论文】面向物体语义理解的视觉表示学习

专知

8+阅读 · 2020年12月4日

面向大数据领域的事理认知图谱构建与推断分析

面向大数据领域的事理认知图谱构建与推断分析

专知

21+阅读 · 2020年8月11日

实体关系抽取方法研究综述

实体关系抽取方法研究综述

专知

14+阅读 · 2020年7月19日

【CVPR2020-北京大学】自适应间隔损失的提升小样本学习

【CVPR2020-北京大学】自适应间隔损失的提升小样本学习

专知

12+阅读 · 2020年6月9日

博士学位论文 | 机器阅读理解与文本问答技术研究

博士学位论文 | 机器阅读理解与文本问答技术研究

PaperWeekly

7+阅读 · 2019年12月19日

论文浅尝 | 混合注意力原型网络的含噪音少样本的关系分类

论文浅尝 | 混合注意力原型网络的含噪音少样本的关系分类

开放知识图谱

12+阅读 · 2019年5月26日

多模态多任务学习新论文

多模态多任务学习新论文

专知

46+阅读 · 2019年2月9日

FAIR&MIT提出知识蒸馏新方法：数据集蒸馏

FAIR&MIT提出知识蒸馏新方法：数据集蒸馏

机器之心

3+阅读 · 2019年2月7日

新任务&数据集：视觉常识推理(VCR)

新任务&数据集：视觉常识推理(VCR)

专知

50+阅读 · 2018年12月1日

EDCHO: High Order Exact Dynamic Consensus

Arxiv

0+阅读 · 2022年2月7日

Uncertainty-aware Joint Salient Object and Camouflaged Object Detection

Arxiv

5+阅读 · 2021年4月6日

Frustratingly Simple Few-Shot Object Detection

Frustratingly Simple Few-Shot Object Detection

Arxiv

3+阅读 · 2020年3月16日

VSGNet: Spatial Attention Network for Detecting Human Object Interactions Using Graph Convolutions

VSGNet: Spatial Attention Network for Detecting Human Object Interactions Using Graph Convolutions

Arxiv

7+阅读 · 2020年3月11日

LayoutLM: Pre-training of Text and Layout for Document Image Understanding

LayoutLM: Pre-training of Text and Layout for Document Image Understanding

Arxiv

12+阅读 · 2020年2月19日

A Survey on Causal Inference

Arxiv

112+阅读 · 2020年2月5日

VrR-VG: Refocusing Visually-Relevant Relationships

VrR-VG: Refocusing Visually-Relevant Relationships

Arxiv

6+阅读 · 2019年8月26日

CapsAttacks: Robust and Imperceptible Adversarial Attacks on Capsule Networks

CapsAttacks: Robust and Imperceptible Adversarial Attacks on Capsule Networks

Arxiv

4+阅读 · 2019年5月24日

Deep Learning

Arxiv

6+阅读 · 2018年8月3日

A Projected Gradient Descent Method for CRF Inference allowing End-To-End Training of Arbitrary Pairwise Potentials

Arxiv

3+阅读 · 2018年1月2日

VIP会员

相关主题

显著性物体检测

视频显著性

CCF优秀博士学位论文奖

图像显著性

相关VIP内容

【博士论文】开放环境下的度量学习研究

【博士论文】开放环境下的度量学习研究

专知会员服务

49+阅读 · 2021年12月4日

【博士论文】视觉语言交互中的视觉推理研究

【博士论文】视觉语言交互中的视觉推理研究

专知会员服务

65+阅读 · 2021年12月1日

南开大学范登平的博士论文《认知规律启发的显著性物体检测方法与评测》

南开大学范登平的博士论文《认知规律启发的显著性物体检测方法与评测》

专知会员服务

23+阅读 · 2021年11月25日

基于深度学习的通用目标检测研究综述

专知会员服务

93+阅读 · 2021年8月29日

【ACL2021】基于图表示的多元关系链接预测

专知会员服务

34+阅读 · 2021年8月9日

【CVPR2021】双图层实例分割，大幅提升遮挡处理性能

专知会员服务

18+阅读 · 2021年5月23日

【AAAI2021】学习场景图之间的相似度实现图像到图像的检索

【AAAI2021】学习场景图之间的相似度实现图像到图像的检索

专知会员服务

38+阅读 · 2021年1月3日

【博士论文】多层图分析技术研究

专知会员服务

38+阅读 · 2020年12月22日

【浙大博士论文】面向复杂场景理解的视觉内容识别、检测与推理方法研究

【浙大博士论文】面向复杂场景理解的视觉内容识别、检测与推理方法研究

专知会员服务

147+阅读 · 2020年7月26日

【CVPR2020-北京大学】自适应间隔损失的提升小样本学习

【CVPR2020-北京大学】自适应间隔损失的提升小样本学习

专知会员服务

85+阅读 · 2020年6月9日

热门VIP内容

开通专知VIP会员享更多权益服务

《建设式兵棋模拟作为战术集群配置优化的关键组成部分》

【博士论文】基于多模态基础模型的上下文学习

《城市滨海地区：理解复杂多变环境下的指挥控制框架》50页报告

《理解城市战及其在俄乌战争中的表现》报告

相关资讯

文本情感分析方法研究综述

文本情感分析方法研究综述

专知

4+阅读 · 2021年4月20日

【博士论文】面向物体语义理解的视觉表示学习

【博士论文】面向物体语义理解的视觉表示学习

专知

8+阅读 · 2020年12月4日

面向大数据领域的事理认知图谱构建与推断分析

面向大数据领域的事理认知图谱构建与推断分析

专知

21+阅读 · 2020年8月11日

实体关系抽取方法研究综述

实体关系抽取方法研究综述

专知

14+阅读 · 2020年7月19日

【CVPR2020-北京大学】自适应间隔损失的提升小样本学习

【CVPR2020-北京大学】自适应间隔损失的提升小样本学习

专知

12+阅读 · 2020年6月9日

博士学位论文 | 机器阅读理解与文本问答技术研究

博士学位论文 | 机器阅读理解与文本问答技术研究

PaperWeekly

7+阅读 · 2019年12月19日

论文浅尝 | 混合注意力原型网络的含噪音少样本的关系分类

论文浅尝 | 混合注意力原型网络的含噪音少样本的关系分类

开放知识图谱

12+阅读 · 2019年5月26日

多模态多任务学习新论文

多模态多任务学习新论文

专知

46+阅读 · 2019年2月9日

FAIR&MIT提出知识蒸馏新方法：数据集蒸馏

FAIR&MIT提出知识蒸馏新方法：数据集蒸馏

机器之心

3+阅读 · 2019年2月7日

新任务&数据集：视觉常识推理(VCR)

新任务&数据集：视觉常识推理(VCR)

专知

50+阅读 · 2018年12月1日

相关论文

EDCHO: High Order Exact Dynamic Consensus

Arxiv

0+阅读 · 2022年2月7日

Uncertainty-aware Joint Salient Object and Camouflaged Object Detection

Arxiv

5+阅读 · 2021年4月6日

Frustratingly Simple Few-Shot Object Detection

Frustratingly Simple Few-Shot Object Detection

Arxiv

3+阅读 · 2020年3月16日

VSGNet: Spatial Attention Network for Detecting Human Object Interactions Using Graph Convolutions

VSGNet: Spatial Attention Network for Detecting Human Object Interactions Using Graph Convolutions

Arxiv

7+阅读 · 2020年3月11日

LayoutLM: Pre-training of Text and Layout for Document Image Understanding

LayoutLM: Pre-training of Text and Layout for Document Image Understanding

Arxiv

12+阅读 · 2020年2月19日

A Survey on Causal Inference

Arxiv

112+阅读 · 2020年2月5日

VrR-VG: Refocusing Visually-Relevant Relationships

VrR-VG: Refocusing Visually-Relevant Relationships

Arxiv

6+阅读 · 2019年8月26日

CapsAttacks: Robust and Imperceptible Adversarial Attacks on Capsule Networks

CapsAttacks: Robust and Imperceptible Adversarial Attacks on Capsule Networks

Arxiv

4+阅读 · 2019年5月24日

Deep Learning

Arxiv

6+阅读 · 2018年8月3日

A Projected Gradient Descent Method for CRF Inference allowing End-To-End Training of Arbitrary Pairwise Potentials

Arxiv

3+阅读 · 2018年1月2日

大家都在搜

朱克爱德华兹家族

大型语言模型

蓝牙安全攻防

模型压缩 | 知识蒸馏经典解读

微信扫码咨询专知VIP会员