In this paper, we introduce a new method for generating an object image from text attributes on a desired location, when the base image is given. One step further to the existing studies on text-to-image generation mainly focusing on the object's appearance, the proposed method aims to generate an object image preserving the given background information, which is the first attempt in this field. To tackle the problem, we propose a multi-conditional GAN (MC-GAN) which controls both the object and background information jointly. As a core component of MC-GAN, we propose a synthesis block which disentangles the object and background information in the training stage. This block enables MC-GAN to generate a realistic object image with the desired background by controlling the amount of the background information from the given base image using the foreground information from the text attributes. From the experiments with Caltech-200 bird and Oxford-102 flower datasets, we show that our model is able to generate photo-realistic images with a resolution of 128 x 128. The source code of MC-GAN is available soon.


翻译:在本文中, 当给定基本图像时, 我们采用一种新的方法, 在一个理想位置的文本属性中生成对象图像。 在目前对文本到图像生成的研究中, 以对象外观为主的一步是, 拟议的方法旨在生成一个保存给定背景资料的物体图像, 这是这个领域的第一次尝试 。 为了解决这个问题, 我们提议了一个多条件的 GAN (MC- GAN), 共同控制对象和背景信息 。 作为 MC- GAN 的核心组成部分, 我们提议了一个合成块, 将对象和背景信息分解在培训阶段。 这个块使 MC- GAN 能够利用文本属性的地面信息控制从给定底图像中获取的背景资料数量, 从而生成符合预期背景的现实对象图像 。 我们通过与 Caltech- 200 鸟和 Oxford- 102 花数据集的实验, 我们显示我们的模型能够生成符合照片现实的图像, 分辨率为 128 x 128. 。 MC- GAN 源码可以很快获得 。

2
下载
关闭预览

相关内容

【Google】平滑对抗训练,Smooth Adversarial Training
专知会员服务
48+阅读 · 2020年7月4日
生成式对抗网络GAN异常检测
专知会员服务
115+阅读 · 2019年10月13日
GAN新书《生成式深度学习》,Generative Deep Learning,379页pdf
专知会员服务
202+阅读 · 2019年9月30日
条件GAN重大改进!cGANs with Projection Discriminator
CreateAMind
8+阅读 · 2018年2月7日
gan生成图像at 1024² 的 代码 论文
CreateAMind
4+阅读 · 2017年10月31日
Adversarial Variational Bayes: Unifying VAE and GAN 代码
CreateAMind
7+阅读 · 2017年10月4日
【推荐】GAN架构入门综述(资源汇总)
机器学习研究会
10+阅读 · 2017年9月3日
Auto-Encoding GAN
CreateAMind
7+阅读 · 2017年8月4日
Generative Adversarial Text to Image Synthesis论文解读
统计学习与视觉计算组
13+阅读 · 2017年6月9日
Arxiv
4+阅读 · 2018年5月21日
Arxiv
5+阅读 · 2018年5月1日
VIP会员
Top
微信扫码咨询专知VIP会员