【CVPR 2022】可控图像合成与编辑的合成生成先验学习，SemanticStyleGAN: Learning Compositonal Generative Priors for Controllable Image Synthesis and Editing - 专知VIP

会员服务 ·

1

CVPR 2022 · 计算机视觉 · 论文 · 数据集 · 视频 ·

2022 年 3 月 3 日

【CVPR 2022】可控图像合成与编辑的合成生成先验学习，SemanticStyleGAN: Learning Compositonal Generative Priors for Controllable Image Synthesis and Editing

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

【可控图像合成与编辑的合成生成先验学习】SemanticStyleGAN: Learning Compositonal Generative Priors for Controllable Image Synthesis and Editing
● 论文摘要：最近的研究表明，StyleGANs为图像合成和编辑的下游任务提供了有前途的预先模型。然而，由于StyleGANs的潜代码是设计来控制全局样式的，因此很难对合成的图像实现细粒度的控制。我们提出了SemanticStyleGAN，它训练一个生成器分别建模局部语义部分，并以合成的方式合成图像。不同局部部位的结构和纹理由相应的潜码控制。实验结果表明，我们的模型提供了不同空间区域之间的强解纠缠。当与为StyleGANs设计的编辑方法相结合时，它可以实现更细粒度的控制来编辑合成的或真实的图像。该模型还可以通过迁移学习扩展到其他领域。因此，作为一个具有内置解纠缠的通用先验模型，它可以促进基于gan的应用程序的开发，并支持更多潜在的下游任务。
● 论文主页：https://semanticstylegan.github.io/
● 论文链接：https://arxiv.org/abs/2112.02236
● 论文代码：（待更新）
● 数据集：FFHQ，DeepFashion
● 论文视频：https://semanticstylegan.github.io/videos/demo.mp4
● 作者单位：字节跳动

成为VIP会员查看完整内容

23

相关内容

CVPR 2022

CVPR 2022 将于2022年 6 月 21-24 日在美国的新奥尔良举行。CVPR是IEEE Conference on Computer Vision and Pattern Recognition的缩写，即IEEE国际计算机视觉与模式识别会议。该会议是由IEEE举办的计算机视觉和模式识别领域的顶级会议，会议的主要内容是计算机视觉与模式识别技术。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等

如何造出逼真图像？南洋理工Chuanxia Zheng博士论文《基于深度生成学习的逼真图像合成》197页pdf阐述视觉合成工作

如何造出逼真图像？南洋理工Chuanxia Zheng博士论文《基于深度生成学习的逼真图像合成》197页pdf阐述视觉合成工作

专知会员服务

51+阅读 · 2022年3月9日

【南洋理工大学Chuanxia Zheng博士论文】基于深度生成学习的逼真图像合成，197页pdf，Synthesizing Photorealistic Images with Deep Generative Learning

【南洋理工大学Chuanxia Zheng博士论文】基于深度生成学习的逼真图像合成，197页pdf，Synthesizing Photorealistic Images with Deep Generative Learning

专知会员服务

20+阅读 · 2022年3月9日

【CVPR 2022】多模态视频字幕的端到端生成预训练，End-to-end Generative Pretraining for Multimodal Video Captioning

【CVPR 2022】多模态视频字幕的端到端生成预训练，End-to-end Generative Pretraining for Multimodal Video Captioning

专知会员服务

27+阅读 · 2022年3月3日

【ACM MM2020】对偶注意力GAN语义图像合成

【ACM MM2020】对偶注意力GAN语义图像合成

专知会员服务

36+阅读 · 2020年9月2日

CVPR 2020 最佳论文与最佳学生论文！

CVPR 2020 最佳论文与最佳学生论文！

专知会员服务

36+阅读 · 2020年6月17日

【推荐】用于解缠学习的半监督StyleGAN，Semi-Supervised StyleGAN for Disentanglement Learning

【推荐】用于解缠学习的半监督StyleGAN，Semi-Supervised StyleGAN for Disentanglement Learning

专知会员服务

36+阅读 · 2020年3月13日

【推荐论文】多通道注意力选择GAN的图像到图像转换，Multi-Channel Attention Selection GANs for Guided Image-to-Image Translation

【推荐论文】多通道注意力选择GAN的图像到图像转换，Multi-Channel Attention Selection GANs for Guided Image-to-Image Translation

专知会员服务

30+阅读 · 2020年2月6日

必读的10篇 CVPR 2019【生成对抗网络】相关论文和代码

必读的10篇 CVPR 2019【生成对抗网络】相关论文和代码

专知会员服务

33+阅读 · 2020年1月10日

【ICCV2019最佳论文官方代码】Official pytorch implementation of the paper: "SinGAN: Learning a Generative Model from a Single Natural Image"(从单一自然图像中学习的无条件生成模型) 附PDF论文

【ICCV2019最佳论文官方代码】Official pytorch implementation of the paper: "SinGAN: Learning a Generative Model from a Single Natural Image"(从单一自然图像中学习的无条件生成模型) 附PDF论文

专知会员服务

22+阅读 · 2019年11月2日

【ICIP 2019 Tutorials】图像到图像的转换（Image-to-Image Translation）,英伟达研究员Ming-Yu Liu

【ICIP 2019 Tutorials】图像到图像的转换（Image-to-Image Translation）,英伟达研究员Ming-Yu Liu

专知会员服务

27+阅读 · 2019年8月10日

CVPR 2022 | DualStyleGAN在手，百变风格我有！

CVPR 2022 | DualStyleGAN在手，百变风格我有！

CVer

2+阅读 · 2022年3月30日

从4K到16K仅用一张图像训练，首个单样本超高分辨率图像合成框架来了

从4K到16K仅用一张图像训练，首个单样本超高分辨率图像合成框架来了

机器之心

1+阅读 · 2022年3月22日

如何造出逼真图像？南洋理工Zheng博士论文《基于深度生成学习的逼真图像合成》197页pdf阐述视觉合成工作

如何造出逼真图像？南洋理工Zheng博士论文《基于深度生成学习的逼真图像合成》197页pdf阐述视觉合成工作

专知

7+阅读 · 2022年3月9日

实践教程｜分割mask生成动漫人脸！爆肝数周，从零搭建

实践教程｜分割mask生成动漫人脸！爆肝数周，从零搭建

极市平台

1+阅读 · 2022年3月1日

第一个GAN驱动的图像编辑框架！多伦多大学华人博士提出EditGAN，最注重细节的GAN模型

第一个GAN驱动的图像编辑框架！多伦多大学华人博士提出EditGAN，最注重细节的GAN模型

新智元

0+阅读 · 2021年11月22日

一张图像百般变化，英伟达用GAN实现高精度细节P图

一张图像百般变化，英伟达用GAN实现高精度细节P图

机器之心

0+阅读 · 2021年11月21日

清华计图开源：智能P图神器DeepFaceEditing

清华计图开源：智能P图神器DeepFaceEditing

机器之心

0+阅读 · 2021年5月6日

CVPR 2020 | 看图说话之随心所欲：细粒度可控的图像描述自动生成

CVPR 2020 | 看图说话之随心所欲：细粒度可控的图像描述自动生成

AI科技评论

14+阅读 · 2020年3月16日

ICCV 2019 最佳论文《SinGAN：从单张自然图像学习生成式模型》中文全译

ICCV 2019 最佳论文《SinGAN：从单张自然图像学习生成式模型》中文全译

AI科技评论

11+阅读 · 2019年10月30日

生成对抗网络GANs学习路线

生成对抗网络GANs学习路线

专知

36+阅读 · 2019年6月10日

牛蒡子中Arctignan A，Lappaol C及其衍生物的合成和抗白血病活性研究

国家自然科学基金

0+阅读 · 2014年12月31日

稀疏表示框架下融合整体结构信息和局部平滑约束的高逼真人脸素描合成方法

国家自然科学基金

1+阅读 · 2013年12月31日

非金属/过渡金属共掺杂的GaN纳米线可控制备及室温铁磁性研究

国家自然科学基金

0+阅读 · 2013年12月31日

二维无机纳米材料异质结构的合成与表征

国家自然科学基金

0+阅读 · 2013年12月31日

VIA族元素共掺杂CoSb3基材料的制备和电热输运机制研究

国家自然科学基金

0+阅读 · 2013年12月31日

基于对象分析的图像/视频内容编辑

国家自然科学基金

2+阅读 · 2012年12月31日

新型超硬材料氮化铼的第一性原理设计

国家自然科学基金

0+阅读 · 2011年12月31日

高效QDSSC导向的新颖ZnO超结构控制合成、形成机理及多元协同界面设计

国家自然科学基金

0+阅读 · 2011年12月31日

基于语义的图像合成

国家自然科学基金

0+阅读 · 2011年12月31日

基于合成样本和MCE准则下判别学习的汉字手写文本识别研究

国家自然科学基金

0+阅读 · 2009年12月31日

Dual-Domain Image Synthesis using Segmentation-Guided GAN

Arxiv

0+阅读 · 2022年4月19日

Sketch guided and progressive growing GAN for realistic and editable ultrasound image synthesis

Arxiv

0+阅读 · 2022年4月19日

Image Data Augmentation for Deep Learning: A Survey

Arxiv

2+阅读 · 2022年4月19日

3D-aware Image Synthesis via Learning Structural and Textural Representations

Arxiv

1+阅读 · 2022年4月18日

VoiceFixer: A Unified Framework for High-Fidelity Speech Restoration

Arxiv

0+阅读 · 2022年4月17日

Vision-Language Pre-Training for Multimodal Aspect-Based Sentiment Analysis

Arxiv

0+阅读 · 2022年4月17日

StyleT2F: Generating Human Faces from Textual Description Using StyleGAN2

Arxiv

0+阅读 · 2022年4月17日

More Control for Free! Image Synthesis with Semantic Diffusion Guidance

Arxiv

1+阅读 · 2022年4月14日

Paradigm Shift in Natural Language Processing

Arxiv

28+阅读 · 2021年9月26日

DeepPath: A Reinforcement Learning Method for Knowledge Graph Reasoning

Arxiv

20+阅读 · 2018年1月8日

VIP会员

相关主题

计算机视觉

相关VIP内容

如何造出逼真图像？南洋理工Chuanxia Zheng博士论文《基于深度生成学习的逼真图像合成》197页pdf阐述视觉合成工作

如何造出逼真图像？南洋理工Chuanxia Zheng博士论文《基于深度生成学习的逼真图像合成》197页pdf阐述视觉合成工作

专知会员服务

51+阅读 · 2022年3月9日

【南洋理工大学Chuanxia Zheng博士论文】基于深度生成学习的逼真图像合成，197页pdf，Synthesizing Photorealistic Images with Deep Generative Learning

【南洋理工大学Chuanxia Zheng博士论文】基于深度生成学习的逼真图像合成，197页pdf，Synthesizing Photorealistic Images with Deep Generative Learning

专知会员服务

20+阅读 · 2022年3月9日

【CVPR 2022】多模态视频字幕的端到端生成预训练，End-to-end Generative Pretraining for Multimodal Video Captioning

【CVPR 2022】多模态视频字幕的端到端生成预训练，End-to-end Generative Pretraining for Multimodal Video Captioning

专知会员服务

27+阅读 · 2022年3月3日

【ACM MM2020】对偶注意力GAN语义图像合成

【ACM MM2020】对偶注意力GAN语义图像合成

专知会员服务

36+阅读 · 2020年9月2日

CVPR 2020 最佳论文与最佳学生论文！

CVPR 2020 最佳论文与最佳学生论文！

专知会员服务

36+阅读 · 2020年6月17日

【推荐】用于解缠学习的半监督StyleGAN，Semi-Supervised StyleGAN for Disentanglement Learning

【推荐】用于解缠学习的半监督StyleGAN，Semi-Supervised StyleGAN for Disentanglement Learning

专知会员服务

36+阅读 · 2020年3月13日

【推荐论文】多通道注意力选择GAN的图像到图像转换，Multi-Channel Attention Selection GANs for Guided Image-to-Image Translation

【推荐论文】多通道注意力选择GAN的图像到图像转换，Multi-Channel Attention Selection GANs for Guided Image-to-Image Translation

专知会员服务

30+阅读 · 2020年2月6日

必读的10篇 CVPR 2019【生成对抗网络】相关论文和代码

必读的10篇 CVPR 2019【生成对抗网络】相关论文和代码

专知会员服务

33+阅读 · 2020年1月10日

【ICCV2019最佳论文官方代码】Official pytorch implementation of the paper: "SinGAN: Learning a Generative Model from a Single Natural Image"(从单一自然图像中学习的无条件生成模型) 附PDF论文

【ICCV2019最佳论文官方代码】Official pytorch implementation of the paper: "SinGAN: Learning a Generative Model from a Single Natural Image"(从单一自然图像中学习的无条件生成模型) 附PDF论文

专知会员服务

22+阅读 · 2019年11月2日

【ICIP 2019 Tutorials】图像到图像的转换（Image-to-Image Translation）,英伟达研究员Ming-Yu Liu

【ICIP 2019 Tutorials】图像到图像的转换（Image-to-Image Translation）,英伟达研究员Ming-Yu Liu

专知会员服务

27+阅读 · 2019年8月10日

热门VIP内容

开通专知VIP会员享更多权益服务

大语言模型基准综述

《自适应训练辅助系统概念导论及其在空战指挥官加速培训中的应用》125页

【剑桥博士论文】多智能体学习中的神经多样性

以色列-伊朗空战：短暂而激烈冲突的启示

相关资讯

CVPR 2022 | DualStyleGAN在手，百变风格我有！

CVPR 2022 | DualStyleGAN在手，百变风格我有！

CVer

2+阅读 · 2022年3月30日

从4K到16K仅用一张图像训练，首个单样本超高分辨率图像合成框架来了

从4K到16K仅用一张图像训练，首个单样本超高分辨率图像合成框架来了

机器之心

1+阅读 · 2022年3月22日

如何造出逼真图像？南洋理工Zheng博士论文《基于深度生成学习的逼真图像合成》197页pdf阐述视觉合成工作

如何造出逼真图像？南洋理工Zheng博士论文《基于深度生成学习的逼真图像合成》197页pdf阐述视觉合成工作

专知

7+阅读 · 2022年3月9日

实践教程｜分割mask生成动漫人脸！爆肝数周，从零搭建

实践教程｜分割mask生成动漫人脸！爆肝数周，从零搭建

极市平台

1+阅读 · 2022年3月1日

第一个GAN驱动的图像编辑框架！多伦多大学华人博士提出EditGAN，最注重细节的GAN模型

第一个GAN驱动的图像编辑框架！多伦多大学华人博士提出EditGAN，最注重细节的GAN模型

新智元

0+阅读 · 2021年11月22日

一张图像百般变化，英伟达用GAN实现高精度细节P图

一张图像百般变化，英伟达用GAN实现高精度细节P图

机器之心

0+阅读 · 2021年11月21日

清华计图开源：智能P图神器DeepFaceEditing

清华计图开源：智能P图神器DeepFaceEditing

机器之心

0+阅读 · 2021年5月6日

CVPR 2020 | 看图说话之随心所欲：细粒度可控的图像描述自动生成

CVPR 2020 | 看图说话之随心所欲：细粒度可控的图像描述自动生成

AI科技评论

14+阅读 · 2020年3月16日

ICCV 2019 最佳论文《SinGAN：从单张自然图像学习生成式模型》中文全译

ICCV 2019 最佳论文《SinGAN：从单张自然图像学习生成式模型》中文全译

AI科技评论

11+阅读 · 2019年10月30日

生成对抗网络GANs学习路线

生成对抗网络GANs学习路线

专知

36+阅读 · 2019年6月10日

相关基金

牛蒡子中Arctignan A，Lappaol C及其衍生物的合成和抗白血病活性研究

国家自然科学基金

0+阅读 · 2014年12月31日

稀疏表示框架下融合整体结构信息和局部平滑约束的高逼真人脸素描合成方法

国家自然科学基金

1+阅读 · 2013年12月31日

非金属/过渡金属共掺杂的GaN纳米线可控制备及室温铁磁性研究

国家自然科学基金

0+阅读 · 2013年12月31日

二维无机纳米材料异质结构的合成与表征

国家自然科学基金

0+阅读 · 2013年12月31日

VIA族元素共掺杂CoSb3基材料的制备和电热输运机制研究

国家自然科学基金

0+阅读 · 2013年12月31日

基于对象分析的图像/视频内容编辑

国家自然科学基金

2+阅读 · 2012年12月31日

新型超硬材料氮化铼的第一性原理设计

国家自然科学基金

0+阅读 · 2011年12月31日

高效QDSSC导向的新颖ZnO超结构控制合成、形成机理及多元协同界面设计

国家自然科学基金

0+阅读 · 2011年12月31日

基于语义的图像合成

国家自然科学基金

0+阅读 · 2011年12月31日

基于合成样本和MCE准则下判别学习的汉字手写文本识别研究

国家自然科学基金

0+阅读 · 2009年12月31日

相关论文

Dual-Domain Image Synthesis using Segmentation-Guided GAN

Arxiv

0+阅读 · 2022年4月19日

Sketch guided and progressive growing GAN for realistic and editable ultrasound image synthesis

Arxiv

0+阅读 · 2022年4月19日

Image Data Augmentation for Deep Learning: A Survey

Arxiv

2+阅读 · 2022年4月19日

3D-aware Image Synthesis via Learning Structural and Textural Representations

Arxiv

1+阅读 · 2022年4月18日

VoiceFixer: A Unified Framework for High-Fidelity Speech Restoration

Arxiv

0+阅读 · 2022年4月17日

Vision-Language Pre-Training for Multimodal Aspect-Based Sentiment Analysis

Arxiv

0+阅读 · 2022年4月17日

StyleT2F: Generating Human Faces from Textual Description Using StyleGAN2

Arxiv

0+阅读 · 2022年4月17日

More Control for Free! Image Synthesis with Semantic Diffusion Guidance

Arxiv

1+阅读 · 2022年4月14日

Paradigm Shift in Natural Language Processing

Arxiv

28+阅读 · 2021年9月26日

DeepPath: A Reinforcement Learning Method for Knowledge Graph Reasoning

Arxiv

20+阅读 · 2018年1月8日

微信扫码咨询专知VIP会员