Most existing human matting algorithms tried to separate pure human-only foreground from the background. In this paper, we propose a Virtual Multi-modality Foreground Matting (VMFM) method to learn human-object interactive foreground (human and objects interacted with him or her) from a raw RGB image. The VMFM method requires no additional inputs, e.g. trimap or known background. We reformulate foreground matting as a self-supervised multi-modality problem: factor each input image into estimated depth map, segmentation mask, and interaction heatmap using three auto-encoders. In order to fully utilize the characteristics of each modality, we first train a dual encoder-to-decoder network to estimate the same alpha matte. Then we introduce a self-supervised method: Complementary Learning(CL) to predict deviation probability map and exchange reliable gradients across modalities without label. We conducted extensive experiments to analyze the effectiveness of each modality and the significance of different components in complementary learning. We demonstrate that our model outperforms the state-of-the-art methods.


翻译:多数现有的人类交配算法试图将纯纯人类的表面与背景区分开来。 在本文中, 我们提出一种虚拟多模式前景图( VMFM) 方法, 以便从原始 RGB 图像中学习人类- 物体交互前景( 人和与人互动的物体) 。 VMFM 方法不需要额外的输入, 例如 trimap 或已知背景。 我们重新将 前景图作为自我监督的多模式问题进行重新配置: 将每种输入图像纳入估计深度图、 分区遮罩和 3个自动编码器的互动热映射中。 为了充分利用每种模式的特性, 我们首先训练一个双向编码器到解析器网络来估计相同的阿尔法面图。 然后我们引入一个自我监督的方法: 补充学习( CLS) 来预测偏离概率图, 并在各种模式之间无标签地交换可靠的梯度。 我们进行了广泛的实验, 分析每一种模式的有效性和不同组成部分在互补学习中的重要性。 我们证明我们的模型超越了状态方法。

0
下载
关闭预览

相关内容

IFIP TC13 Conference on Human-Computer Interaction是人机交互领域的研究者和实践者展示其工作的重要平台。多年来,这些会议吸引了来自几个国家和文化的研究人员。官网链接:http://interact2019.org/
专知会员服务
39+阅读 · 2021年7月4日
专知会员服务
59+阅读 · 2021年3月17日
【WWW2021】多视角图对比学习的药物药物交互预测
专知会员服务
53+阅读 · 2021年1月29日
近期必读的7篇 CVPR 2019【视觉问答】相关论文和代码
专知会员服务
35+阅读 · 2020年1月10日
CVPR 2019 | 34篇 CVPR 2019 论文实现代码
AI科技评论
21+阅读 · 2019年6月23日
无人机视觉挑战赛 | ICCV 2019 Workshop—VisDrone2019
PaperWeekly
7+阅读 · 2019年5月5日
弱监督语义分割最新方法资源列表
专知
9+阅读 · 2019年2月26日
TCN v2 + 3Dconv 运动信息
CreateAMind
4+阅读 · 2019年1月8日
STRCF for Visual Object Tracking
统计学习与视觉计算组
14+阅读 · 2018年5月29日
VIP会员
相关VIP内容
专知会员服务
39+阅读 · 2021年7月4日
专知会员服务
59+阅读 · 2021年3月17日
【WWW2021】多视角图对比学习的药物药物交互预测
专知会员服务
53+阅读 · 2021年1月29日
近期必读的7篇 CVPR 2019【视觉问答】相关论文和代码
专知会员服务
35+阅读 · 2020年1月10日
Top
微信扫码咨询专知VIP会员