【CVPR2022】GaTector：凝视对象预测的统一框架 - 专知

会员服务 ·

0

【CVPR2022】GaTector：凝视对象预测的统一框架

2022 年 3 月 24 日 专知

凝视行为是人类社会行为的一个重要方面，具有很强的研究意义，但针对该任务缺乏一个统一的解决框架。一个直观的解决方案是在现有的视线估计方法中加入一个目标检测分支。然而，现有的视线估计方法通常使用两个不同的网络来提取场景和头部图像中的特征，这将导致网络结构过于复杂并阻止每个分支的联合优化。

https://www.zhuanzhi.ai/paper/bc53529bc71e91a3504fa5162f10a186

为此，论文提出了一个名为GaTector的新框架，以统一的方式解决凝视对象的预测问题。首先本文提出了一个特定-一般-特定（SGS）的特征提取器，利用一个共享的主干来提取场景和头部图像的一般特征。针对不同子网络的特殊性，SGS在共享主干之前引入了两个特定的输入处理层，在共享主干之后引入了三个不同的输出处理层。然后，本文设计了一个新颖的散焦结构，在不丢失信息且无需额外计算量的前提下为目标检测任务生成特定的物体特征。此外，框架引入了能量聚集损失，对不同的子网络完成联合优化。最后，本文提出了一个新的mDAP指标，即使不同边界框之间没有重叠的区域，它也可以揭示不同边界框之间的差异。此框架在GOO数据集上进行的大量实验验证了本文的方法在目标检测、视线估计和凝视物体预测三个任务中的优越性。

CVPR全称IEEE国际计算机视觉与模式识别会议(IEEE Conference on Computer Vision and Pattern Recognition），该会议始于1983年，是人工智能、计算机视觉和模式识别领域的顶级会议。根据谷歌学术公布的 2021 年最新学术期刊和会议影响力排名， CVPR在所有学术刊物中位居第4（超越柳叶刀），仅次于Nature，NEJM和Science。

专知便捷查看

便捷下载，请关注专知公众号（点击上方蓝色专知关注）

后台回复“GaTector” 就可以获取《【CVPR2022】GaTector：凝视对象预测的统一框架》专知下载链接

请扫码加入专知人工智能群（长按二维码），或者加专知小助手微信（zhuanzhi02），加入专知主题群（请备注主题类型：AI、NLP、CV、 KG、论文等）交流~

专知，专业可信的人工智能知识分发 ，让认知协作更快更好！欢迎注册登录专知www.zhuanzhi.ai，获取70000+AI主题干货知识资料！

欢迎微信扫一扫加入专知人工智能知识星球群，获取最新AI专业干货知识教程资料和与专家交流咨询！

点击“ 阅读原文 ”，了解使用专知 ，查看获取70000+AI主题知识资源

登录查看更多

0

相关内容

GaTector

【CVPR2022】CAT-Det:用于多模态三维物体检测的对比增强Transformer

【CVPR2022】CAT-Det:用于多模态三维物体检测的对比增强Transformer

专知会员服务

19+阅读 · 2022年4月7日

【CVPR2022】语言引导与基于视觉的深度度量学习的集成

【CVPR2022】语言引导与基于视觉的深度度量学习的集成

专知会员服务

17+阅读 · 2022年3月17日

【CVPR2022】UniVIP：自监督视觉预训练的统一框架

【CVPR2022】UniVIP：自监督视觉预训练的统一框架

专知会员服务

28+阅读 · 2022年3月16日

【CVPR 2022】单黑箱和多黑箱预测的领域适应，DINE: Domain Adaptation from Single and Multiple Black-box Predictors

【CVPR 2022】单黑箱和多黑箱预测的领域适应，DINE: Domain Adaptation from Single and Multiple Black-box Predictors

专知会员服务

14+阅读 · 2022年3月12日

【CVPR2022】弱监督目标定位建模为领域适应

【CVPR2022】弱监督目标定位建模为领域适应

专知会员服务

17+阅读 · 2022年3月4日

【AAAI 2022】跨模态目标跟踪: 模态感知表示和统一基准

【AAAI 2022】跨模态目标跟踪: 模态感知表示和统一基准

专知会员服务

44+阅读 · 2022年1月6日

【CVPR2021】密集对比学习的自监督视觉预训练

专知会员服务

39+阅读 · 2021年5月16日

【CVPR2021】基于Transformer的视频分割领域

【CVPR2021】基于Transformer的视频分割领域

专知会员服务

38+阅读 · 2021年4月16日

【CVPR2021】加法器神经网络（AdderNet）单图像超分辨率

专知会员服务

18+阅读 · 2021年3月16日

【WWW2021】用优化框架解释和统一图神经网络

【WWW2021】用优化框架解释和统一图神经网络

专知会员服务

45+阅读 · 2021年2月1日

【CVPR2022】CAT-Det:用于多模态三维物体检测的对比增强Transformer

【CVPR2022】CAT-Det:用于多模态三维物体检测的对比增强Transformer

专知

2+阅读 · 2022年4月7日

【CVPR2022】ContrastMask:对比学习来分割各种

【CVPR2022】ContrastMask:对比学习来分割各种

专知

0+阅读 · 2022年3月21日

【CVPR2022】自动驾驶中的伪双目三维目标检测

【CVPR2022】自动驾驶中的伪双目三维目标检测

专知

2+阅读 · 2022年3月19日

【CVPR2022】语言引导与基于视觉的深度度量学习的集成

【CVPR2022】语言引导与基于视觉的深度度量学习的集成

专知

3+阅读 · 2022年3月17日

【CVPR2022】UniVIP：自监督视觉预训练的统一框架

【CVPR2022】UniVIP：自监督视觉预训练的统一框架

专知

1+阅读 · 2022年3月16日

【CVPR2022】通过特征Mixing进行主动学习

【CVPR2022】通过特征Mixing进行主动学习

专知

0+阅读 · 2022年3月15日

【CVPR2022】双曲图像分割

【CVPR2022】双曲图像分割

专知

2+阅读 · 2022年3月14日

【AAAI 2022】跨模态目标跟踪: 模态感知表示和统一基准

【AAAI 2022】跨模态目标跟踪: 模态感知表示和统一基准

专知

0+阅读 · 2022年1月6日

【CVPR2021】基于Transformer的视频分割领域

【CVPR2021】基于Transformer的视频分割领域

专知

2+阅读 · 2021年4月16日

【CVPR2021】基于端到端预训练的视觉-语言表征学习

【CVPR2021】基于端到端预训练的视觉-语言表征学习

专知

3+阅读 · 2021年4月9日

数据驱动的人体图像语义分割研究

国家自然科学基金

4+阅读 · 2014年12月31日

基于主动轮廓模型的图像分割与目标跟踪研究

国家自然科学基金

1+阅读 · 2012年12月31日

视觉显著性与共分割框架融合的舌象分割研究

国家自然科学基金

0+阅读 · 2012年12月31日

基于多层上下文关系的图像目标识别关键技术研究

国家自然科学基金

0+阅读 · 2012年12月31日

基于特征结构关系的目标分类研究

国家自然科学基金

1+阅读 · 2012年12月31日

基于非欧氏空间的视觉计算理论与方法

国家自然科学基金

1+阅读 · 2011年12月31日

数据集多尺度特征提取与表达的视觉凹度方法

国家自然科学基金

1+阅读 · 2011年12月31日

基于数据驱动的多模态工业过程监控理论及应用

国家自然科学基金

1+阅读 · 2010年12月31日

模拟视觉信息处理机制的视频对象行为识别

国家自然科学基金

0+阅读 · 2009年12月31日

基于目标的注意模型及在图像分割和目标检测中的应用

国家自然科学基金

1+阅读 · 2009年12月31日

DEUP: Direct Epistemic Uncertainty Prediction

Arxiv

0+阅读 · 2022年4月19日

Scalable and Real-time Multi-Camera Vehicle Detection, Re-Identification, and Tracking

Arxiv

0+阅读 · 2022年4月15日

Capacity Analysis of Intersections When CAVs Crossing in a Collaborative and Lane-Free Order

Arxiv

0+阅读 · 2022年4月13日

Generalized Out-of-Distribution Detection: A Survey

Generalized Out-of-Distribution Detection: A Survey

Arxiv

15+阅读 · 2021年10月21日

Domain Generalization in Vision: A Survey

Arxiv

16+阅读 · 2021年7月18日

A Survey on Deep Domain Adaptation and Tiny Object Detection Challenges, Techniques and Datasets

Arxiv

17+阅读 · 2021年7月16日

A Survey on Multi-Task Learning

Arxiv

31+阅读 · 2021年3月29日

Text Detection and Recognition in the Wild: A Review

Arxiv

20+阅读 · 2020年6月8日

Explainable Artificial Intelligence (XAI): Concepts, Taxonomies, Opportunities and Challenges toward Responsible AI

Explainable Artificial Intelligence (XAI): Concepts, Taxonomies, Opportunities and Challenges toward Responsible AI

Arxiv

77+阅读 · 2019年10月22日

Scene Text Detection and Recognition: The Deep Learning Era

Scene Text Detection and Recognition: The Deep Learning Era

Arxiv

27+阅读 · 2019年9月5日

VIP会员

相关主题

相关VIP内容

【CVPR2022】CAT-Det:用于多模态三维物体检测的对比增强Transformer

【CVPR2022】CAT-Det:用于多模态三维物体检测的对比增强Transformer

专知会员服务

19+阅读 · 2022年4月7日

【CVPR2022】语言引导与基于视觉的深度度量学习的集成

【CVPR2022】语言引导与基于视觉的深度度量学习的集成

专知会员服务

17+阅读 · 2022年3月17日

【CVPR2022】UniVIP：自监督视觉预训练的统一框架

【CVPR2022】UniVIP：自监督视觉预训练的统一框架

专知会员服务

28+阅读 · 2022年3月16日

【CVPR 2022】单黑箱和多黑箱预测的领域适应，DINE: Domain Adaptation from Single and Multiple Black-box Predictors

【CVPR 2022】单黑箱和多黑箱预测的领域适应，DINE: Domain Adaptation from Single and Multiple Black-box Predictors

专知会员服务

14+阅读 · 2022年3月12日

【CVPR2022】弱监督目标定位建模为领域适应

【CVPR2022】弱监督目标定位建模为领域适应

专知会员服务

17+阅读 · 2022年3月4日

【AAAI 2022】跨模态目标跟踪: 模态感知表示和统一基准

【AAAI 2022】跨模态目标跟踪: 模态感知表示和统一基准

专知会员服务

44+阅读 · 2022年1月6日

【CVPR2021】密集对比学习的自监督视觉预训练

专知会员服务

39+阅读 · 2021年5月16日

【CVPR2021】基于Transformer的视频分割领域

【CVPR2021】基于Transformer的视频分割领域

专知会员服务

38+阅读 · 2021年4月16日

【CVPR2021】加法器神经网络（AdderNet）单图像超分辨率

专知会员服务

18+阅读 · 2021年3月16日

【WWW2021】用优化框架解释和统一图神经网络

【WWW2021】用优化框架解释和统一图神经网络

专知会员服务

45+阅读 · 2021年2月1日

热门VIP内容

开通专知VIP会员享更多权益服务

《乌克兰无人机产业：志愿者与政策在构建新兴无人机产业中的协同作用》最新报告

《人工智能辅助决策中的数据可视化：系统性综述》

人工智能驱动弹药制造现代化：美国陆军转型之路

《敏捷作战部署中枢纽-辐条基地选址优化研究》80页

相关资讯

【CVPR2022】CAT-Det:用于多模态三维物体检测的对比增强Transformer

【CVPR2022】CAT-Det:用于多模态三维物体检测的对比增强Transformer

专知

2+阅读 · 2022年4月7日

【CVPR2022】ContrastMask:对比学习来分割各种

【CVPR2022】ContrastMask:对比学习来分割各种

专知

0+阅读 · 2022年3月21日

【CVPR2022】自动驾驶中的伪双目三维目标检测

【CVPR2022】自动驾驶中的伪双目三维目标检测

专知

2+阅读 · 2022年3月19日

【CVPR2022】语言引导与基于视觉的深度度量学习的集成

【CVPR2022】语言引导与基于视觉的深度度量学习的集成

专知

3+阅读 · 2022年3月17日

【CVPR2022】UniVIP：自监督视觉预训练的统一框架

【CVPR2022】UniVIP：自监督视觉预训练的统一框架

专知

1+阅读 · 2022年3月16日

【CVPR2022】通过特征Mixing进行主动学习

【CVPR2022】通过特征Mixing进行主动学习

专知

0+阅读 · 2022年3月15日

【CVPR2022】双曲图像分割

【CVPR2022】双曲图像分割

专知

2+阅读 · 2022年3月14日

【AAAI 2022】跨模态目标跟踪: 模态感知表示和统一基准

【AAAI 2022】跨模态目标跟踪: 模态感知表示和统一基准

专知

0+阅读 · 2022年1月6日

【CVPR2021】基于Transformer的视频分割领域

【CVPR2021】基于Transformer的视频分割领域

专知

2+阅读 · 2021年4月16日

【CVPR2021】基于端到端预训练的视觉-语言表征学习

【CVPR2021】基于端到端预训练的视觉-语言表征学习

专知

3+阅读 · 2021年4月9日

相关基金

数据驱动的人体图像语义分割研究

国家自然科学基金

4+阅读 · 2014年12月31日

基于主动轮廓模型的图像分割与目标跟踪研究

国家自然科学基金

1+阅读 · 2012年12月31日

视觉显著性与共分割框架融合的舌象分割研究

国家自然科学基金

0+阅读 · 2012年12月31日

基于多层上下文关系的图像目标识别关键技术研究

国家自然科学基金

0+阅读 · 2012年12月31日

基于特征结构关系的目标分类研究

国家自然科学基金

1+阅读 · 2012年12月31日

基于非欧氏空间的视觉计算理论与方法

国家自然科学基金

1+阅读 · 2011年12月31日

数据集多尺度特征提取与表达的视觉凹度方法

国家自然科学基金

1+阅读 · 2011年12月31日

基于数据驱动的多模态工业过程监控理论及应用

国家自然科学基金

1+阅读 · 2010年12月31日

模拟视觉信息处理机制的视频对象行为识别

国家自然科学基金

0+阅读 · 2009年12月31日

基于目标的注意模型及在图像分割和目标检测中的应用

国家自然科学基金

1+阅读 · 2009年12月31日

相关论文

DEUP: Direct Epistemic Uncertainty Prediction

Arxiv

0+阅读 · 2022年4月19日

Scalable and Real-time Multi-Camera Vehicle Detection, Re-Identification, and Tracking

Arxiv

0+阅读 · 2022年4月15日

Capacity Analysis of Intersections When CAVs Crossing in a Collaborative and Lane-Free Order

Arxiv

0+阅读 · 2022年4月13日

Generalized Out-of-Distribution Detection: A Survey

Generalized Out-of-Distribution Detection: A Survey

Arxiv

15+阅读 · 2021年10月21日

Domain Generalization in Vision: A Survey

Arxiv

16+阅读 · 2021年7月18日

A Survey on Deep Domain Adaptation and Tiny Object Detection Challenges, Techniques and Datasets

Arxiv

17+阅读 · 2021年7月16日

A Survey on Multi-Task Learning

Arxiv

31+阅读 · 2021年3月29日

Text Detection and Recognition in the Wild: A Review

Arxiv

20+阅读 · 2020年6月8日

Explainable Artificial Intelligence (XAI): Concepts, Taxonomies, Opportunities and Challenges toward Responsible AI

Explainable Artificial Intelligence (XAI): Concepts, Taxonomies, Opportunities and Challenges toward Responsible AI

Arxiv

77+阅读 · 2019年10月22日

Scene Text Detection and Recognition: The Deep Learning Era

Scene Text Detection and Recognition: The Deep Learning Era

Arxiv

27+阅读 · 2019年9月5日

大家都在搜

CMU博士论文

无人机集群

国防科技创新

软件无线电

无人机航拍交通事故现场勘查处置系统——行业第一的警用事故处理软件

微信扫码咨询专知VIP会员