【ACM MM2020】对偶注意力GAN语义图像合成 - 专知VIP

会员服务 ·

3

ACM Multimedia 2020 · 对偶注意力 · GAN · 图像合成 ·

2020 年 9 月 2 日

【ACM MM2020】对偶注意力GAN语义图像合成

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

在本文中，我们关注的是语义图像合成任务，目的是将语义标记映射迁移到逼真的图像。现有的方法在保留语义信息方面缺乏有效的语义约束，忽略了空间维度和通道维度上的结构相关性，导致结果模糊且容易产生假象。为了解决这些限制，我们提出了一种新的对偶注意力GAN (DAGAN)，它可以合成具有输入布局细节的真实照片和语义一致的图像，而不增加额外的训练开销或修改现有方法的网络结构。我们还提出了两个新的模块，即位置-方向的空间注意力模块和尺度-方向的通道注意模块，分别用于捕获空间和通道维度上的语义结构注意力。具体来说，SAM通过空间注意力图选择性地将每个位置的像素关联起来，从而使得具有相同语义标签的像素无论在空间上的距离如何都相互关联起来。同时，CAM通过通道注意力图选择性地强调每个通道上的标度特征，从而在所有的通道图中集成相关的特征，而不管它们的标度如何。最后对SAM和CAM的结果进行求和，进一步改进特征表示。在四个具有挑战性的数据集上进行的广泛实验表明，DAGAN取得了比最先进的方法显著更好的结果，同时使用更少的模型参数。源代码和经过训练的模型可以在这个https URL中获得。

https://arxiv.org/abs/2008.13024

成为VIP会员查看完整内容

36

相关内容

ACM Multimedia 2020

ACM Multimedia 2020

【NeurIPS2020】迭代深度图学习的图神经网络:更好和鲁棒的节点嵌入

【NeurIPS2020】迭代深度图学习的图神经网络:更好和鲁棒的节点嵌入

专知会员服务

31+阅读 · 2020年9月30日

【ACMMM2020】小规模行人检测的自模拟学习

【ACMMM2020】小规模行人检测的自模拟学习

专知会员服务

15+阅读 · 2020年9月25日

【ACM MM2020-计算所】基于多源语义嵌入的场景识别的广义零样本学习

【ACM MM2020-计算所】基于多源语义嵌入的场景识别的广义零样本学习

专知会员服务

22+阅读 · 2020年9月5日

【ACMMM2020】零样本语义分割的上下文感知特征生成

【ACMMM2020】零样本语义分割的上下文感知特征生成

专知会员服务

16+阅读 · 2020年8月21日

最新《生成式对抗网络GAN时空数据应用》综述论文，28pdf

最新《生成式对抗网络GAN时空数据应用》综述论文，28pdf

专知会员服务

70+阅读 · 2020年8月21日

【ACM Multimedia 2020】共同注意力网络的自监督视听表示学习

【ACM Multimedia 2020】共同注意力网络的自监督视听表示学习

专知会员服务

28+阅读 · 2020年8月14日

【ACMMM2020-北航】协作双路径度量的小样本学习

【ACMMM2020-北航】协作双路径度量的小样本学习

专知会员服务

29+阅读 · 2020年8月11日

生成对抗网络GAN正则化方法: 近期研究综述

专知会员服务

109+阅读 · 2020年5月21日

【CVPR2020】MSG-GAN:用于稳定图像合成的多尺度梯度GAN

【CVPR2020】MSG-GAN:用于稳定图像合成的多尺度梯度GAN

专知会员服务

29+阅读 · 2020年4月6日

【推荐论文】多通道注意力选择GAN的图像到图像转换，Multi-Channel Attention Selection GANs for Guided Image-to-Image Translation

【推荐论文】多通道注意力选择GAN的图像到图像转换，Multi-Channel Attention Selection GANs for Guided Image-to-Image Translation

专知会员服务

30+阅读 · 2020年2月6日

ICCV 2019 | Lifelong GAN：基于持续学习的条件图像生成模型

ICCV 2019 | Lifelong GAN：基于持续学习的条件图像生成模型

PaperWeekly

7+阅读 · 2019年8月27日

CVPR 2019：微软最新提出ObjGAN，输入一句话秒生成图片

CVPR 2019：微软最新提出ObjGAN，输入一句话秒生成图片

新智元

7+阅读 · 2019年6月23日

能生成逼真图像的不只有 GAN

能生成逼真图像的不只有 GAN

机器学习算法与Python学习

8+阅读 · 2019年6月6日

【学界】Google用更少标签生成图像，还提出一个用于训练评估GAN的库

【学界】Google用更少标签生成图像，还提出一个用于训练评估GAN的库

GAN生成式对抗网络

23+阅读 · 2019年4月10日

降维打击：这款GAN可以让真人「二次元化」

降维打击：这款GAN可以让真人「二次元化」

机器之心

6+阅读 · 2018年12月11日

镜头间的风格转换行人重识别

镜头间的风格转换行人重识别

统计学习与视觉计算组

13+阅读 · 2018年8月16日

【学界】基于生成对抗网络的低秩图像生成方法

【学界】基于生成对抗网络的低秩图像生成方法

GAN生成式对抗网络

9+阅读 · 2018年7月13日

【深度】Ian Goodfellow等提出自注意力GAN，ImageNet图像合成获最优结果！

【深度】Ian Goodfellow等提出自注意力GAN，ImageNet图像合成获最优结果！

GAN生成式对抗网络

4+阅读 · 2018年5月27日

Ian Goodfellow等提出自注意力GAN，ImageNet图像合成获最优结果！

Ian Goodfellow等提出自注意力GAN，ImageNet图像合成获最优结果！

新智元

11+阅读 · 2018年5月24日

探幽深度生成模型的两种方法：VAE和GAN

探幽深度生成模型的两种方法：VAE和GAN

AI前线

15+阅读 · 2018年3月10日

On the Power and Limits of Dynamic Pricing in Combinatorial Markets

Arxiv

0+阅读 · 2020年10月12日

Shape-aware Generative Adversarial Networks for Attribute Transfer

Arxiv

0+阅读 · 2020年10月11日

Attention Driven Fusion for Multi-Modal Emotion Recognition

Arxiv

0+阅读 · 2020年10月10日

Continuously Indexed Domain Adaptation

Arxiv

8+阅读 · 2020年8月30日

Recommending Themes for Ad Creative Design via Visual-Linguistic Representations

Arxiv

4+阅读 · 2020年2月27日

MMKG: Multi-Modal Knowledge Graphs

Arxiv

30+阅读 · 2019年3月13日

Compositional GAN: Learning Conditional Image Composition

Compositional GAN: Learning Conditional Image Composition

Arxiv

31+阅读 · 2018年7月19日

Sem-GAN: Semantically-Consistent Image-to-Image Translation

Sem-GAN: Semantically-Consistent Image-to-Image Translation

Arxiv

4+阅读 · 2018年7月12日

Zero-Shot Sketch-Image Hashing

Arxiv

5+阅读 · 2018年3月6日

StarGAN: Unified Generative Adversarial Networks for Multi-Domain Image-to-Image Translation

Arxiv

5+阅读 · 2017年11月24日

VIP会员

相关主题

ACM Multimedia 2020

对偶注意力

相关VIP内容

【NeurIPS2020】迭代深度图学习的图神经网络:更好和鲁棒的节点嵌入

【NeurIPS2020】迭代深度图学习的图神经网络:更好和鲁棒的节点嵌入

专知会员服务

31+阅读 · 2020年9月30日

【ACMMM2020】小规模行人检测的自模拟学习

【ACMMM2020】小规模行人检测的自模拟学习

专知会员服务

15+阅读 · 2020年9月25日

【ACM MM2020-计算所】基于多源语义嵌入的场景识别的广义零样本学习

【ACM MM2020-计算所】基于多源语义嵌入的场景识别的广义零样本学习

专知会员服务

22+阅读 · 2020年9月5日

【ACMMM2020】零样本语义分割的上下文感知特征生成

【ACMMM2020】零样本语义分割的上下文感知特征生成

专知会员服务

16+阅读 · 2020年8月21日

最新《生成式对抗网络GAN时空数据应用》综述论文，28pdf

最新《生成式对抗网络GAN时空数据应用》综述论文，28pdf

专知会员服务

70+阅读 · 2020年8月21日

【ACM Multimedia 2020】共同注意力网络的自监督视听表示学习

【ACM Multimedia 2020】共同注意力网络的自监督视听表示学习

专知会员服务

28+阅读 · 2020年8月14日

【ACMMM2020-北航】协作双路径度量的小样本学习

【ACMMM2020-北航】协作双路径度量的小样本学习

专知会员服务

29+阅读 · 2020年8月11日

生成对抗网络GAN正则化方法: 近期研究综述

专知会员服务

109+阅读 · 2020年5月21日

【CVPR2020】MSG-GAN:用于稳定图像合成的多尺度梯度GAN

【CVPR2020】MSG-GAN:用于稳定图像合成的多尺度梯度GAN

专知会员服务

29+阅读 · 2020年4月6日

【推荐论文】多通道注意力选择GAN的图像到图像转换，Multi-Channel Attention Selection GANs for Guided Image-to-Image Translation

【推荐论文】多通道注意力选择GAN的图像到图像转换，Multi-Channel Attention Selection GANs for Guided Image-to-Image Translation

专知会员服务

30+阅读 · 2020年2月6日

热门VIP内容

开通专知VIP会员享更多权益服务

《毁灭算法：解析以色列在加沙的AI军事行动》

【COLT 2025最新教程】语言生成

以机器速度锁定目标：人工智能的能力与局限

【ICML2025】通过在线世界模型规划的持续强化学习

相关资讯

ICCV 2019 | Lifelong GAN：基于持续学习的条件图像生成模型

ICCV 2019 | Lifelong GAN：基于持续学习的条件图像生成模型

PaperWeekly

7+阅读 · 2019年8月27日

CVPR 2019：微软最新提出ObjGAN，输入一句话秒生成图片

CVPR 2019：微软最新提出ObjGAN，输入一句话秒生成图片

新智元

7+阅读 · 2019年6月23日

能生成逼真图像的不只有 GAN

能生成逼真图像的不只有 GAN

机器学习算法与Python学习

8+阅读 · 2019年6月6日

【学界】Google用更少标签生成图像，还提出一个用于训练评估GAN的库

【学界】Google用更少标签生成图像，还提出一个用于训练评估GAN的库

GAN生成式对抗网络

23+阅读 · 2019年4月10日

降维打击：这款GAN可以让真人「二次元化」

降维打击：这款GAN可以让真人「二次元化」

机器之心

6+阅读 · 2018年12月11日

镜头间的风格转换行人重识别

镜头间的风格转换行人重识别

统计学习与视觉计算组

13+阅读 · 2018年8月16日

【学界】基于生成对抗网络的低秩图像生成方法

【学界】基于生成对抗网络的低秩图像生成方法

GAN生成式对抗网络

9+阅读 · 2018年7月13日

【深度】Ian Goodfellow等提出自注意力GAN，ImageNet图像合成获最优结果！

【深度】Ian Goodfellow等提出自注意力GAN，ImageNet图像合成获最优结果！

GAN生成式对抗网络

4+阅读 · 2018年5月27日

Ian Goodfellow等提出自注意力GAN，ImageNet图像合成获最优结果！

Ian Goodfellow等提出自注意力GAN，ImageNet图像合成获最优结果！

新智元

11+阅读 · 2018年5月24日

探幽深度生成模型的两种方法：VAE和GAN

探幽深度生成模型的两种方法：VAE和GAN

AI前线

15+阅读 · 2018年3月10日

相关论文

On the Power and Limits of Dynamic Pricing in Combinatorial Markets

Arxiv

0+阅读 · 2020年10月12日

Shape-aware Generative Adversarial Networks for Attribute Transfer

Arxiv

0+阅读 · 2020年10月11日

Attention Driven Fusion for Multi-Modal Emotion Recognition

Arxiv

0+阅读 · 2020年10月10日

Continuously Indexed Domain Adaptation

Arxiv

8+阅读 · 2020年8月30日

Recommending Themes for Ad Creative Design via Visual-Linguistic Representations

Arxiv

4+阅读 · 2020年2月27日

MMKG: Multi-Modal Knowledge Graphs

Arxiv

30+阅读 · 2019年3月13日

Compositional GAN: Learning Conditional Image Composition

Compositional GAN: Learning Conditional Image Composition

Arxiv

31+阅读 · 2018年7月19日

Sem-GAN: Semantically-Consistent Image-to-Image Translation

Sem-GAN: Semantically-Consistent Image-to-Image Translation

Arxiv

4+阅读 · 2018年7月12日

Zero-Shot Sketch-Image Hashing

Arxiv

5+阅读 · 2018年3月6日

StarGAN: Unified Generative Adversarial Networks for Multi-Domain Image-to-Image Translation

Arxiv

5+阅读 · 2017年11月24日

微信扫码咨询专知VIP会员