Portrait matting is an important research problem with a wide range of applications, such as video conference app, image/video editing, and post-production. The goal is to predict an alpha matte that identifies the effect of each pixel on the foreground subject. Traditional approaches and most of the existing works utilized an additional input, e.g., trimap, background image, to predict alpha matte. However, providing additional input is not always practical. Besides, models are too sensitive to these additional inputs. In this paper, we introduce an additional input-free approach to perform portrait matting using Generative Adversarial Nets (GANs). We divide the main task into two subtasks. For this, we propose a segmentation network for the person segmentation and the alpha generation network for alpha matte prediction. While the segmentation network takes an input image and produces a coarse segmentation map, the alpha generation network utilizes the same input image as well as a coarse segmentation map that is produced by the segmentation network to predict the alpha matte. Besides, we present a segmentation encoding block to downsample the coarse segmentation map and provide feature representation to the residual block. Furthermore, we propose border loss to penalize only the borders of the subject separately which is more likely to be challenging and we also adapt perceptual loss for portrait matting. To train the proposed system, we combine two different popular training datasets to improve the amount of data as well as diversity to address domain shift problems in the inference time. We tested our model on three different benchmark datasets, namely Adobe Image Matting dataset, Portrait Matting dataset, and Distinctions dataset. The proposed method outperformed the MODNet method that also takes a single input.


翻译:光线交配是一个重要的研究问题, 包括视频会议应用程序、 图像/ 视频编辑、 制作后等多种应用。 目标是预测一个 Alpha matte, 确定每个像素对前景主题的影响 。 传统的方法和大部分现有作品都使用了额外的输入, 例如 滴图、 背景图像, 来预测阿尔法面。 但是, 提供额外的输入并不总是实用的。 此外, 模型对这些额外投入过于敏感 。 在本文中, 我们引入了一种额外的不使用 Genealation Adversarial Nets (GANs) 来进行肖像化配配方的无内容化方法 。 我们将主要任务分为两个子任务 。 为此, 我们提议了一个人分解和阿尔法生成网络网络, 用于预测阿尔法 。 分解网络使用相同的输入模型以及由分解网络生成的粗略分解分解图来预测阿尔法 。 此外, 我们用一个分解法将主要任务分为两个直径的图像区域, 将数据转换为我们的数据路段 。

0
下载
关闭预览

相关内容

多样性算力技术愿景白皮书
专知会员服务
83+阅读 · 2021年4月29日
数字化健康白皮书,17页pdf
专知会员服务
108+阅读 · 2021年1月6日
 【SIGGRAPH 2020】人像阴影处理,Portrait Shadow Manipulation
专知会员服务
29+阅读 · 2020年5月19日
【SIGGRAPH2019】TensorFlow 2.0深度学习计算机图形学应用
专知会员服务
41+阅读 · 2019年10月9日
一文带你读懂 SegNet(语义分割)
AI研习社
19+阅读 · 2019年3月9日
A Technical Overview of AI & ML in 2018 & Trends for 2019
待字闺中
17+阅读 · 2018年12月24日
Hierarchical Disentangled Representations
CreateAMind
4+阅读 · 2018年4月15日
条件GAN重大改进!cGANs with Projection Discriminator
CreateAMind
8+阅读 · 2018年2月7日
gan生成图像at 1024² 的 代码 论文
CreateAMind
4+阅读 · 2017年10月31日
【学习】Hierarchical Softmax
机器学习研究会
4+阅读 · 2017年8月6日
Generative Adversarial Text to Image Synthesis论文解读
统计学习与视觉计算组
13+阅读 · 2017年6月9日
Real-Time High-Resolution Background Matting
Arxiv
4+阅读 · 2020年12月14日
Arxiv
3+阅读 · 2020年7月16日
Arxiv
7+阅读 · 2018年1月21日
Arxiv
5+阅读 · 2016年12月29日
VIP会员
Top
微信扫码咨询专知VIP会员