为了使得视觉与学习领域相关从业者快速及时地了解领域的最新发展动态和前沿技术进展,VALSE最新推出了《论文速览》栏目,将在每周二和周五各发布一篇顶会顶刊论文的录制视频,对单个前沿工作进行细致讲解。本期VALSE论文速览选取了来自悉尼大学的可解释解耦表征学习工作。该工作由陶大程教授和徐畅副教授指导,朱鑫祺同学录制,将为大家呈现可解释解耦表征学习最前沿的进展。
论文题目:可解释解耦表征中的位置与内容假设
作者列表:朱鑫祺 (悉尼大学),徐畅 (悉尼大学),陶大程 (悉尼大学)
B站观看网址:
https://www.bilibili.com/video/BV1jh411z7i5/
复制链接到浏览器打开或点击阅读原文即可跳转至观看页面。
论文摘要:
捕捉可解释的变化模式是解耦学习的一个目标。不同于独立性假设,利用可解释性来促进解耦的方法并未在无监督的设定下被广泛发掘。在本篇论文中,我们从两个角度来验证解耦学习中的可解释性假设:位置上的可解释性和内容上的可解释性。一个隐编码可以较容易地被解释如果它能一致地影响一个生成图片中某个子区域的内容。我们因此提出用一个空间掩膜来局域化隐编码的某维对图片的影响。另一方面,可解释性一般来自于数据中简单和基础的变化。我们因此对隐编码的某一维施加一个扰动,利用强化对此维扰动的易识别性来促使实现延轴简单变化的编码。我们还提出了一个通过延隐空间轴累积感知距离的方式来筛选无监督解耦模型的方法。我们展示在多个数据集上,我们的模型可以无监督地学到高质量的解耦表征。这些结果表示,建模可解释性假设是一个达成无监督解耦的有效方法。本文入选了CVPR 2021的口头报告,并获得了CVPR2021最佳论文奖提名。
论文信息:
[1] Xinqi Zhu, Chang Xu, Dacheng Tao,“Where and What? Examining Interpretable Disentangled Representations,” in Proceeding of IEEE Computer Vision and Pattern Recognition (CVPR 2021), June 2021.
论文链接:
[https://arxiv.org/abs/2104.05622]
视频讲者简介:
朱鑫祺,悉尼大学计算机系三年级博士生。研究兴趣包括解耦表征学习,计算机视觉,机器学习。2018年从上海交通大学获得学士学位。在ICML,CVPR,ICCV,ECCV等国际会议上发表多篇论文,并在ICML,NeurIPS,ICLR,CVPR,ACMMM等国际会议上担任审稿人。
看到这了,确定不关注下吗?关注下再走吧~
特别鸣谢本次论文速览主要组织者:
月度轮值AC:王栋 (大连理工大学)、王鹤 (北京大学)
季度责任AC:王兴刚 (华中科技大学)
活动参与方式
1、VALSE每周举行的Webinar活动依托B站直播平台进行,直播地址:https://live.bilibili.com/22300737;VALSE的近期历史视频可在这里观看:https://space.bilibili.com/562085182/
2、VALSE Webinar活动通常每周三晚上20:00进行,但偶尔会因为讲者时区问题略有调整,为方便您参加活动,请关注VALSE微信公众号:valse_wechat 或加入VALSE QQ Q群,群号:698303207);
*注:申请加入VALSE QQ群时需验证姓名、单位和身份,缺一不可。入群后,请实名,姓名身份单位。身份:学校及科研单位人员T;企业研发I;博士D;硕士M。
3. VALSE微信公众号一般会在每周四发布下一周Webinar报告的通知。
4、您也可以通过访问VALSE主页:http://valser.org/ 直接查看Webinar活动信息。Webinar报告的PPT(经讲者允许后),会在VALSE官网每期报告通知的最下方更新。