To address the challenging portrait video matting problem more precisely, existing works typically apply some matting priors that require additional user efforts to obtain, such as annotated trimaps or background images. In this work, we observe that instead of asking the user to explicitly provide a background image, we may recover it from the input video itself. To this end, we first propose a novel background restoration module (BRM) to recover the background image dynamically from the input video. BRM is extremely lightweight and can be easily integrated into existing matting models. By combining BRM with a recent image matting model, MODNet, we then present MODNet-V for portrait video matting. Benefited from the strong background prior provided by BRM, MODNet-V has only 1/3 of the parameters of MODNet but achieves comparable or even better performances. Our design allows MODNet-V to be trained in an end-to-end manner on a single NVIDIA 3090 GPU. Finally, we introduce a new patch refinement module (PRM) to adapt MODNet-V for high-resolution videos while keeping MODNet-V lightweight and fast.


翻译:为了更准确地解决具有挑战性的肖像视频交配问题,现有作品通常会应用一些需要更多用户努力才能获取的交配前科,例如附加说明的三角图或背景图像。 在这项工作中,我们观察到,我们不是要求用户明确提供背景图像,而是从输入视频本身中收回。为此,我们首先提出一个新的背景恢复模块(BRM),以便从输入视频中动态地恢复背景图像。BRM非常轻,很容易融入现有的交配模型。通过将BRM与最近的图像交配模型(MODNet)相结合,我们然后将MODNet-V用于肖像性视频交配。从BRM之前提供的强势背景中获益,MODNet-V只有MODNet参数的三分之一,但取得类似或更好的性能。我们的设计允许MODNet-V在保持MODNet-V光量和快速光量的同时,对单一的NVIDIA 3090 GPU进行端到端培训。最后,我们引入一个新的补补制模块(PRM),以适应MODNet-V的高分辨率视频。

1
下载
关闭预览

相关内容

【CVPR 2021】变换器跟踪TransT: Transformer Tracking
专知会员服务
21+阅读 · 2021年4月20日
专知会员服务
109+阅读 · 2020年3月12日
【SIGGRAPH2019】TensorFlow 2.0深度学习计算机图形学应用
专知会员服务
39+阅读 · 2019年10月9日
已删除
将门创投
3+阅读 · 2019年9月4日
CVPR 2019 | 34篇 CVPR 2019 论文实现代码
AI科技评论
21+阅读 · 2019年6月23日
逆强化学习-学习人先验的动机
CreateAMind
15+阅读 · 2019年1月18日
计算机视觉近一年进展综述
机器学习研究会
9+阅读 · 2017年11月25日
gan生成图像at 1024² 的 代码 论文
CreateAMind
4+阅读 · 2017年10月31日
MoCoGAN 分解运动和内容的视频生成
CreateAMind
18+阅读 · 2017年10月21日
Auto-Encoding GAN
CreateAMind
7+阅读 · 2017年8月4日
Real-Time High-Resolution Background Matting
Arxiv
4+阅读 · 2020年12月14日
VIP会员
相关资讯
已删除
将门创投
3+阅读 · 2019年9月4日
CVPR 2019 | 34篇 CVPR 2019 论文实现代码
AI科技评论
21+阅读 · 2019年6月23日
逆强化学习-学习人先验的动机
CreateAMind
15+阅读 · 2019年1月18日
计算机视觉近一年进展综述
机器学习研究会
9+阅读 · 2017年11月25日
gan生成图像at 1024² 的 代码 论文
CreateAMind
4+阅读 · 2017年10月31日
MoCoGAN 分解运动和内容的视频生成
CreateAMind
18+阅读 · 2017年10月21日
Auto-Encoding GAN
CreateAMind
7+阅读 · 2017年8月4日
Top
微信扫码咨询专知VIP会员