VALSE 论文速览第51期：Cross-Encoder: 无监督视线表示学习框架 - 专知

会员服务 ·

0

VALSE 论文速览第51期：Cross-Encoder: 无监督视线表示学习框架

2022 年 2 月 20 日 VALSE

为了使得视觉与学习领域相关从业者快速及时地了解领域的最新发展动态和前沿技术进展，VALSE最新推出了《论文速览》栏目，将在每周发布一至两篇顶会顶刊论文的录制视频，对单个前沿工作进行细致讲解。本期VALSE论文速览选取了来自计算技术研究所等机构的无监督视线表示学习方面的工作。该工作由山世光研究员指导，论文第一作者孙蕴嘉同学录制。

论文题目：Cross-Encoder for Unsupervised Gaze Representation Learning

作者列表：孙蕴嘉 (中国科学院计算技术研究所，中国科学院大学)，曾加贝 (中国科学院计算技术研究所)，山世光 (中国科学院计算技术研究所，中国科学院大学)，陈熙霖 (中国科学院计算技术研究所，中国科学院大学)

B站观看网址：

https://www.bilibili.com/video/BV1V44y1n7q8/

复制链接到浏览器打开或点击阅读原文即可跳转至观看页面。

论文摘要：

为了在没有大量标注数据的情况下进行 3D 视线估计的深度学习，我们提出了无监督学习框架 Cross-Encoder，利用无标签数据来学习视线估计的表示。为了解决视线特征总是与眼睛特征耦合在一起的问题，Cross-Encoder 在“相同眼图像对”和“视线相似图像对”上交换一部分特征，以达到解耦的目的。具体来说，每张图像都会被编码为一个视线特征和一个眼睛特征。Cross-Encoder根据其视线特征和图像对中另一图像的眼睛特征来重构“相同眼图像对”中的每幅图像，而根据眼睛特征和图像对中另一图像的视线特征重构“视线相似图像对”中的每幅图像。实验结果证明了我们工作的有效性。首先，不论是跨数据集，还是在同一数据集内，Cross-Encoder学习的视线表示在使用很少样本训练的情况下，优于其他无监督学习方法。其次，由Cross-Encoder预训练的ResNet18能与目前最好的视线估计方法相匹敌。最后，消融实验表明，Cross-Encoder解耦了视线特征与眼部特征。

论文信息：

[1] Yunjia Sun, Jiabei Zeng, Shiguang Shan, Xilin Chen, "Cross-Encoder for Unsupervised Gaze Representation Learning," 18th International Conference on Computer Vision (ICCV 2021), pp. 3702-3711, Virtual, October 11-17, 2021.

论文链接：

[https://openaccess.thecvf.com/content/ICCV2021/papers/Sun_Cross-Encoder_for_Unsupervised_Gaze_Representation_Learning_ICCV_2021_paper.pdf]

代码链接：

[https://github.com/sunyunjia96/Cross-Encoder]

视频讲者简介：

孙蕴嘉，中国科学院大学、中国科学院计算技术研究所博士生，研究方向为计算机视觉，目前专注于3D视线估计。

特别鸣谢本次论文速览主要组织者：

月度轮值AC：刘昊 (宁夏大学)、叶茫 (武汉大学)

季度责任AC：杨猛 (中山大学)

活动参与方式

1、VALSE每周举行的Webinar活动依托B站直播平台进行，欢迎在B站搜索VALSE_Webinar关注我们！

直播地址：

https://live.bilibili.com/22300737；

历史视频观看地址：

https://space.bilibili.com/562085182/

2、VALSE Webinar活动通常每周三晚上20:00进行，但偶尔会因为讲者时区问题略有调整，为方便您参加活动，请关注VALSE微信公众号：valse_wechat 或加入VALSE QQ R群，群号：137634472）；

*注：申请加入VALSE QQ群时需验证姓名、单位和身份，缺一不可。入群后，请实名，姓名身份单位。身份：学校及科研单位人员T；企业研发I；博士D；硕士M。

3、VALSE微信公众号一般会在每周四发布下一周Webinar报告的通知。

4、您也可以通过访问VALSE主页：http://valser.org/ 直接查看Webinar活动信息。Webinar报告的PPT（经讲者允许后），会在VALSE官网每期报告通知的最下方更新。

看到这了，确定不关注下吗？关注下再走吧～

登录查看更多

0

相关内容

VALSE研讨会

VALSE 发起于 2011年，是 Vision And Learning Seminar 的简写，取“华尔兹舞”之意。目的是为全球计算机视觉、模式识别、机器学习、多媒体技术等相关领域的华人青年学者提供一个平等、自由的学术交流舞台。官网：http://valser.org/

【CVPR2022】UniVIP：自监督视觉预训练的统一框架

【CVPR2022】UniVIP：自监督视觉预训练的统一框架

专知会员服务

28+阅读 · 2022年3月16日

AAAI 2022 | 基于预训练-微调框架的图像差异描述任务

AAAI 2022 | 基于预训练-微调框架的图像差异描述任务

专知会员服务

18+阅读 · 2022年2月26日

近期必读的5篇顶会WWW 2021【对比学习（CL）】相关论文和代码

专知会员服务

51+阅读 · 2021年6月17日

近期必读的六篇ICLR 2021【对比学习（CL）】相关论文和代码

专知会员服务

26+阅读 · 2021年3月2日

近期必读的七篇NeurIPS 2020【对比学习】相关论文和代码

近期必读的七篇NeurIPS 2020【对比学习】相关论文和代码

专知会员服务

66+阅读 · 2020年10月20日

近期必读的六篇 ICML 2020【元学习（Meta Learning）】相关论文

近期必读的六篇 ICML 2020【元学习（Meta Learning）】相关论文

专知会员服务

45+阅读 · 2020年9月25日

近期必读的六篇 ICML 2020【对比学习】相关论文

近期必读的六篇 ICML 2020【对比学习】相关论文

专知会员服务

57+阅读 · 2020年9月15日

近期必读的六篇计算机视觉顶会ECCV 2020【目标检测】相关论文

近期必读的六篇计算机视觉顶会ECCV 2020【目标检测】相关论文

专知会员服务

59+阅读 · 2020年7月7日

近期必读的7篇【医学图像分割】相关论文和代码（CVPR、AAAI）

近期必读的7篇【医学图像分割】相关论文和代码（CVPR、AAAI）

专知会员服务

41+阅读 · 2020年1月10日

最新BERT相关论文清单，BERT-related Papers

最新BERT相关论文清单，BERT-related Papers

专知会员服务

53+阅读 · 2019年9月29日

VALSE 论文速览第54期：Learngene：从开放世界到目标学习任务

VALSE 论文速览第54期：Learngene：从开放世界到目标学习任务

VALSE

1+阅读 · 2022年3月2日

VALSE 论文速览第46期：基于多层次特征优化的自监督视频表征学习

VALSE 论文速览第46期：基于多层次特征优化的自监督视频表征学习

VALSE

0+阅读 · 2022年2月1日

VALSE 论文速览第34期：Oriented R-CNN: 有向目标检测

VALSE 论文速览第34期：Oriented R-CNN: 有向目标检测

VALSE

0+阅读 · 2021年12月17日

VALSE 论文速览第22期：基于噪声鲁棒对比损失的部分视图对齐表示学习

VALSE 论文速览第22期：基于噪声鲁棒对比损失的部分视图对齐表示学习

VALSE

0+阅读 · 2021年10月30日

VALSE 论文速览第21期：利用加权损失的部分标记学习

VALSE 论文速览第21期：利用加权损失的部分标记学习

VALSE

0+阅读 · 2021年10月27日

VALSE 论文速览第20期：GAIA：一个目标检测下游迁移框架

VALSE 论文速览第20期：GAIA：一个目标检测下游迁移框架

VALSE

0+阅读 · 2021年10月26日

VALSE 论文速览第19期：基于Transformer的视觉目标跟踪

VALSE 论文速览第19期：基于Transformer的视觉目标跟踪

VALSE

0+阅读 · 2021年10月21日

VALSE 论文速览第17期：基于对比预测的缺失视图聚类方法

VALSE 论文速览第17期：基于对比预测的缺失视图聚类方法

VALSE

1+阅读 · 2021年10月7日

VALSE 论文速览第08期：基于单张图像的三维场景重建

VALSE 论文速览第08期：基于单张图像的三维场景重建

VALSE

2+阅读 · 2021年8月17日

VALSE 论文速览第02期：探索简单孪生网络表征学习

VALSE 论文速览第02期：探索简单孪生网络表征学习

VALSE

0+阅读 · 2021年7月23日

基于结构约束的多模态学习理论和方法

国家自然科学基金

6+阅读 · 2014年12月31日

基于弱监督学习的图像语义分割研究

国家自然科学基金

4+阅读 · 2014年12月31日

基于迁移学习的脑机接口特征提取和预测方法研究

国家自然科学基金

2+阅读 · 2013年12月31日

基于小框架的pMRI图像重建研究

国家自然科学基金

0+阅读 · 2013年12月31日

低秩矩阵恢复算法及其在图像处理中的应用

国家自然科学基金

1+阅读 · 2012年12月31日

基于图感知学习的多流形分析方法及实证研究

国家自然科学基金

1+阅读 · 2012年12月31日

基于弱监督学习和深度信息的目标跟踪算法研究

国家自然科学基金

0+阅读 · 2012年12月31日

联合基于学习的超分辨率技术和多传感器超分辨率技术在红外图像复原中的研究

国家自然科学基金

0+阅读 · 2012年12月31日

多重集典型相关分析的特征抽取理论及扩展研究

国家自然科学基金

0+阅读 · 2012年12月31日

动力系统及相关课题学术会议

国家自然科学基金

0+阅读 · 2012年4月30日

Deep subspace encoders for continuous-time state-space identification

Arxiv

0+阅读 · 2022年4月20日

Cross-stitched Multi-modal Encoders

Arxiv

0+阅读 · 2022年4月20日

A Contrastive Cross-Channel Data Augmentation Framework for Aspect-based Sentiment Analysis

Arxiv

0+阅读 · 2022年4月16日

Compressive Sensing-Based Recovery of Molecular Mixtures with Cross-Reactive Receptor Arrays

Arxiv

0+阅读 · 2022年4月16日

Cross-Domain Few-Shot Graph Classification

Arxiv

13+阅读 · 2022年1月20日

Contrastive Spatio-Temporal Pretext Learning for Self-supervised Video Representation

Arxiv

11+阅读 · 2021年12月16日

PEGASUS: Pre-training with Extracted Gap-sentences for Abstractive Summarization

Arxiv

17+阅读 · 2020年6月2日

A Simple Framework for Contrastive Learning of Visual Representations

Arxiv

21+阅读 · 2020年2月13日

Domain Representation for Knowledge Graph Embedding

Domain Representation for Knowledge Graph Embedding

Arxiv

14+阅读 · 2019年9月11日

Text Generation from Knowledge Graphs with Graph Transformers

Arxiv

35+阅读 · 2019年4月4日

VIP会员

相关主题

中国科学院计算技术研究所

相关VIP内容

【CVPR2022】UniVIP：自监督视觉预训练的统一框架

【CVPR2022】UniVIP：自监督视觉预训练的统一框架

专知会员服务

28+阅读 · 2022年3月16日

AAAI 2022 | 基于预训练-微调框架的图像差异描述任务

AAAI 2022 | 基于预训练-微调框架的图像差异描述任务

专知会员服务

18+阅读 · 2022年2月26日

近期必读的5篇顶会WWW 2021【对比学习（CL）】相关论文和代码

专知会员服务

51+阅读 · 2021年6月17日

近期必读的六篇ICLR 2021【对比学习（CL）】相关论文和代码

专知会员服务

26+阅读 · 2021年3月2日

近期必读的七篇NeurIPS 2020【对比学习】相关论文和代码

近期必读的七篇NeurIPS 2020【对比学习】相关论文和代码

专知会员服务

66+阅读 · 2020年10月20日

近期必读的六篇 ICML 2020【元学习（Meta Learning）】相关论文

近期必读的六篇 ICML 2020【元学习（Meta Learning）】相关论文

专知会员服务

45+阅读 · 2020年9月25日

近期必读的六篇 ICML 2020【对比学习】相关论文

近期必读的六篇 ICML 2020【对比学习】相关论文

专知会员服务

57+阅读 · 2020年9月15日

近期必读的六篇计算机视觉顶会ECCV 2020【目标检测】相关论文

近期必读的六篇计算机视觉顶会ECCV 2020【目标检测】相关论文

专知会员服务

59+阅读 · 2020年7月7日

近期必读的7篇【医学图像分割】相关论文和代码（CVPR、AAAI）

近期必读的7篇【医学图像分割】相关论文和代码（CVPR、AAAI）

专知会员服务

41+阅读 · 2020年1月10日

最新BERT相关论文清单，BERT-related Papers

最新BERT相关论文清单，BERT-related Papers

专知会员服务

53+阅读 · 2019年9月29日

热门VIP内容

开通专知VIP会员享更多权益服务

【CMU博士论文】数据驱动决策中的激励、信息与不确定性

DGP双粒度提示框架：图增强大模型助力欺诈检测

【ICCV2025】ESSENTIAL：用于视频类增量学习的情景记忆与语义记忆整合

唯快不破：大型语言模型高效架构综述

相关资讯

VALSE 论文速览第54期：Learngene：从开放世界到目标学习任务

VALSE 论文速览第54期：Learngene：从开放世界到目标学习任务

VALSE

1+阅读 · 2022年3月2日

VALSE 论文速览第46期：基于多层次特征优化的自监督视频表征学习

VALSE 论文速览第46期：基于多层次特征优化的自监督视频表征学习

VALSE

0+阅读 · 2022年2月1日

VALSE 论文速览第34期：Oriented R-CNN: 有向目标检测

VALSE 论文速览第34期：Oriented R-CNN: 有向目标检测

VALSE

0+阅读 · 2021年12月17日

VALSE 论文速览第22期：基于噪声鲁棒对比损失的部分视图对齐表示学习

VALSE 论文速览第22期：基于噪声鲁棒对比损失的部分视图对齐表示学习

VALSE

0+阅读 · 2021年10月30日

VALSE 论文速览第21期：利用加权损失的部分标记学习

VALSE 论文速览第21期：利用加权损失的部分标记学习

VALSE

0+阅读 · 2021年10月27日

VALSE 论文速览第20期：GAIA：一个目标检测下游迁移框架

VALSE 论文速览第20期：GAIA：一个目标检测下游迁移框架

VALSE

0+阅读 · 2021年10月26日

VALSE 论文速览第19期：基于Transformer的视觉目标跟踪

VALSE 论文速览第19期：基于Transformer的视觉目标跟踪

VALSE

0+阅读 · 2021年10月21日

VALSE 论文速览第17期：基于对比预测的缺失视图聚类方法

VALSE 论文速览第17期：基于对比预测的缺失视图聚类方法

VALSE

1+阅读 · 2021年10月7日

VALSE 论文速览第08期：基于单张图像的三维场景重建

VALSE 论文速览第08期：基于单张图像的三维场景重建

VALSE

2+阅读 · 2021年8月17日

VALSE 论文速览第02期：探索简单孪生网络表征学习

VALSE 论文速览第02期：探索简单孪生网络表征学习

VALSE

0+阅读 · 2021年7月23日

相关基金

基于结构约束的多模态学习理论和方法

国家自然科学基金

6+阅读 · 2014年12月31日

基于弱监督学习的图像语义分割研究

国家自然科学基金

4+阅读 · 2014年12月31日

基于迁移学习的脑机接口特征提取和预测方法研究

国家自然科学基金

2+阅读 · 2013年12月31日

基于小框架的pMRI图像重建研究

国家自然科学基金

0+阅读 · 2013年12月31日

低秩矩阵恢复算法及其在图像处理中的应用

国家自然科学基金

1+阅读 · 2012年12月31日

基于图感知学习的多流形分析方法及实证研究

国家自然科学基金

1+阅读 · 2012年12月31日

基于弱监督学习和深度信息的目标跟踪算法研究

国家自然科学基金

0+阅读 · 2012年12月31日

联合基于学习的超分辨率技术和多传感器超分辨率技术在红外图像复原中的研究

国家自然科学基金

0+阅读 · 2012年12月31日

多重集典型相关分析的特征抽取理论及扩展研究

国家自然科学基金

0+阅读 · 2012年12月31日

动力系统及相关课题学术会议

国家自然科学基金

0+阅读 · 2012年4月30日

相关论文

Deep subspace encoders for continuous-time state-space identification

Arxiv

0+阅读 · 2022年4月20日

Cross-stitched Multi-modal Encoders

Arxiv

0+阅读 · 2022年4月20日

A Contrastive Cross-Channel Data Augmentation Framework for Aspect-based Sentiment Analysis

Arxiv

0+阅读 · 2022年4月16日

Compressive Sensing-Based Recovery of Molecular Mixtures with Cross-Reactive Receptor Arrays

Arxiv

0+阅读 · 2022年4月16日

Cross-Domain Few-Shot Graph Classification

Arxiv

13+阅读 · 2022年1月20日

Contrastive Spatio-Temporal Pretext Learning for Self-supervised Video Representation

Arxiv

11+阅读 · 2021年12月16日

PEGASUS: Pre-training with Extracted Gap-sentences for Abstractive Summarization

Arxiv

17+阅读 · 2020年6月2日

A Simple Framework for Contrastive Learning of Visual Representations

Arxiv

21+阅读 · 2020年2月13日

Domain Representation for Knowledge Graph Embedding

Domain Representation for Knowledge Graph Embedding

Arxiv

14+阅读 · 2019年9月11日

Text Generation from Knowledge Graphs with Graph Transformers

Arxiv

35+阅读 · 2019年4月4日

大家都在搜

CMU博士论文

无人机集群

软件无线电

国防科技创新

论文浅尝 - ICLR2020 | 通过神经逻辑归纳学习有效地解释

微信扫码咨询专知VIP会员