This paper proposes a simple self-supervised approach for learning a representation for visual correspondence from raw video. We cast correspondence as prediction of links in a space-time graph constructed from video. In this graph, the nodes are patches sampled from each frame, and nodes adjacent in time can share a directed edge. We learn a representation in which pairwise similarity defines transition probability of a random walk, so that long-range correspondence is computed as a walk along the graph. We optimize the representation to place high probability along paths of similarity. Targets for learning are formed without supervision, by cycle-consistency: the objective is to maximize the likelihood of returning to the initial node when walking along a graph constructed from a palindrome of frames. Thus, a single path-level constraint implicitly supervises chains of intermediate comparisons. When used as a similarity metric without adaptation, the learned representation outperforms the self-supervised state-of-the-art on label propagation tasks involving objects, semantic parts, and pose. Moreover, we demonstrate that a technique we call edge dropout, as well as self-supervised adaptation at test-time, further improve transfer for object-centric correspondence.


翻译:本文建议了一种简单的自我监督方法, 学习原始视频中的视觉通信代表方式。 我们投递函文作为视频构建的空间时段图中链接的预测。 在这张图中, 节点是每个框架样本的补丁, 时间相邻的节点可以共享定向边缘 。 我们学习了一种代表方式, 即双向相似性可以定义随机行走的过渡概率, 这样长距离通信可以以图上行走的方式计算出来 。 我们优化了代表方式, 以便沿着相似的路径放置高的概率 。 学习目标是通过循环一致性在没有监督的情况下形成 : 目标是在沿着从框架的顶层构造绘制的图上行走时, 最大限度地将返回初始节点的可能性最大化 。 因此, 一个单一路径级的制约可以隐含着监督中间比较链 。 当作为类似性指标使用时, 学习的代号超越了在标签传播任务上自我监督的状态, 包括物体、 语义部分 和 姿势上。 此外, 我们证明一种技术叫做边缘丢物, 以及测试时自我监控的对等通信的转换 。

0
下载
关闭预览

相关内容

在数学中,随机漫步是一种数学对象,称为随机过程或随机过程,它描述的路径由在某些数学空间(例如整数)上的一系列随机步骤组成。随机行走等是指基于过去的表现,无法预测将来的发展步骤和方向。核心概念是指任何无规则行走者所带的守恒量都各自对应着一个扩散运输定律 ,接近于布朗运动,是布朗运动理想的数学状态,现阶段主要应用于互联网链接分析及金融股票市场中。
基于深度学习的图像分析技术,116页ppt
专知会员服务
53+阅读 · 2020年7月17日
【MIT】反偏差对比学习,Debiased Contrastive Learning
专知会员服务
90+阅读 · 2020年7月4日
【Google】监督对比学习,Supervised Contrastive Learning
专知会员服务
72+阅读 · 2020年4月24日
专知会员服务
109+阅读 · 2020年3月12日
【深度学习视频分析/多模态学习资源大列表】
专知会员服务
91+阅读 · 2019年10月16日
2019年机器学习框架回顾
专知会员服务
35+阅读 · 2019年10月11日
[综述]深度学习下的场景文本检测与识别
专知会员服务
77+阅读 · 2019年10月10日
Unsupervised Learning via Meta-Learning
CreateAMind
41+阅读 · 2019年1月3日
已删除
将门创投
7+阅读 · 2018年8月28日
Arxiv
7+阅读 · 2020年10月9日
Arxiv
4+阅读 · 2018年6月5日
VIP会员
相关VIP内容
基于深度学习的图像分析技术,116页ppt
专知会员服务
53+阅读 · 2020年7月17日
【MIT】反偏差对比学习,Debiased Contrastive Learning
专知会员服务
90+阅读 · 2020年7月4日
【Google】监督对比学习,Supervised Contrastive Learning
专知会员服务
72+阅读 · 2020年4月24日
专知会员服务
109+阅读 · 2020年3月12日
【深度学习视频分析/多模态学习资源大列表】
专知会员服务
91+阅读 · 2019年10月16日
2019年机器学习框架回顾
专知会员服务
35+阅读 · 2019年10月11日
[综述]深度学习下的场景文本检测与识别
专知会员服务
77+阅读 · 2019年10月10日
相关资讯
Unsupervised Learning via Meta-Learning
CreateAMind
41+阅读 · 2019年1月3日
已删除
将门创投
7+阅读 · 2018年8月28日
Top
微信扫码咨询专知VIP会员