【CVPR 2022】基于Transformer的图象风格化，StyTr2: Image Style Transfer with Transformers - 专知VIP

会员服务 ·

3

CVPR 2022 · Transformer · 图像风格迁移 · 中科院自动化所 · 论文 ·

2022 年 3 月 19 日

【CVPR 2022】基于Transformer的图象风格化，StyTr2: Image Style Transfer with Transformers

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

本文提出了一种基于Transformer的图像风格迁移方法，即StyTr2，将输入图像的长期依赖关系引入到风格化中。与用于其它视觉任务的Transformer不同，本文设计的StyTr2包含两个不同的Transformer编码器，分别为内容和风格图片生成具有不同域特征的序列。在编码器之后，采用多层Transformer解码器，根据风格序列对内容序列进行风格化。此外，本文分析了现有位置编码方法的不足，提出了内容感知的位置编码，该方法具有尺度不变特性，更适合于图像风格化任务。与基于CNN和基于流的最新方法相比，定性和定量实验均证明了StyTr2的有效性。

网络结构

风格化结果比较

成为VIP会员查看完整内容

11

相关内容

CVPR 2022

CVPR 2022 将于2022年 6 月 21-24 日在美国的新奥尔良举行。CVPR是IEEE Conference on Computer Vision and Pattern Recognition的缩写，即IEEE国际计算机视觉与模式识别会议。该会议是由IEEE举办的计算机视觉和模式识别领域的顶级会议，会议的主要内容是计算机视觉与模式识别技术。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等

【CVPR2022】基于粗-精视觉Transformer的仿射医学图像配准

【CVPR2022】基于粗-精视觉Transformer的仿射医学图像配准

专知会员服务

36+阅读 · 2022年4月2日

【CVPR 2022】基于windows的图像压缩注意，The Devil Is in the Details: Window-based Attention for Image Compression

【CVPR 2022】基于windows的图像压缩注意，The Devil Is in the Details: Window-based Attention for Image Compression

专知会员服务

8+阅读 · 2022年3月12日

【CVPR 2022】自由风格的文本-人脸合成和操作，AnyFace: Free-style Text-to-Face Synthesis and Manipulation

【CVPR 2022】自由风格的文本-人脸合成和操作，AnyFace: Free-style Text-to-Face Synthesis and Manipulation

专知会员服务

8+阅读 · 2022年3月12日

[CVPR 2021] 序列到序列对比学习的文本识别

专知会员服务

14+阅读 · 2021年5月2日

【AAAI2021最佳论文】基于高效 Transformer 的长时间序列预测

【AAAI2021最佳论文】基于高效 Transformer 的长时间序列预测

专知会员服务

62+阅读 · 2021年2月6日

【CVPR2020】通过自适应GANs生成不同的图像，Diverse Image Generation via Self-Conditioned GANs

【CVPR2020】通过自适应GANs生成不同的图像，Diverse Image Generation via Self-Conditioned GANs

专知会员服务

34+阅读 · 2020年6月19日

新杀器来了！Facebook AI提出DETR：用Transformers来进行端到端的目标检测

新杀器来了！Facebook AI提出DETR：用Transformers来进行端到端的目标检测

专知会员服务

51+阅读 · 2020年5月28日

【CVPR2020】用于图像超分辨率的深度展开网络，Deep Unfolding Network for Image Super-Resolution

【CVPR2020】用于图像超分辨率的深度展开网络，Deep Unfolding Network for Image Super-Resolution

专知会员服务

44+阅读 · 2020年3月26日

必读的10篇 CVPR 2019【生成对抗网络】相关论文和代码

必读的10篇 CVPR 2019【生成对抗网络】相关论文和代码

专知会员服务

33+阅读 · 2020年1月10日

【字节跳动&Adobe】图割多模态风格迁移，Multimodal Style Transfer via Graph Cuts

【字节跳动&Adobe】图割多模态风格迁移，Multimodal Style Transfer via Graph Cuts

专知会员服务

15+阅读 · 2020年1月9日

CVPR 2022 Oral | MLP进军底层视觉！谷歌提出MAXIM：刷榜多个图像处理任务，代码已开源！

CVPR 2022 Oral | MLP进军底层视觉！谷歌提出MAXIM：刷榜多个图像处理任务，代码已开源！

CVer

0+阅读 · 2022年4月9日

一文看尽 CVPR 2022 最新 20 篇 Oral 论文

一文看尽 CVPR 2022 最新 20 篇 Oral 论文

极市平台

1+阅读 · 2022年4月8日

CVPR 2022｜快手&中科院开源StyTr^2：基于Transformer的图像风格化方法

CVPR 2022｜快手&中科院开源StyTr^2：基于Transformer的图像风格化方法

CVer

1+阅读 · 2022年4月8日

CVPR 2022｜快手联合中科院自动化所提出基于Transformer的图像风格化方法

CVPR 2022｜快手联合中科院自动化所提出基于Transformer的图像风格化方法

极市平台

0+阅读 · 2022年4月5日

CVPR 2022 | DualStyleGAN在手，百变风格我有！

CVPR 2022 | DualStyleGAN在手，百变风格我有！

CVer

2+阅读 · 2022年3月30日

CVPR 2022 | GeoTransformer：基于Transformer的点云配准网络

CVPR 2022 | GeoTransformer：基于Transformer的点云配准网络

PaperWeekly

2+阅读 · 2022年3月30日

谷歌提出MaskGIT：掩码生成图像Transformer

谷歌提出MaskGIT：掩码生成图像Transformer

CVer

2+阅读 · 2022年3月21日

超越Swin！MoA-Transformer：将全局特征聚合到视觉Transformer

超越Swin！MoA-Transformer：将全局特征聚合到视觉Transformer

CVer

2+阅读 · 2022年2月8日

视觉Transformer BERT预训练新方法！中科大&MSRA等提出PeCo：卷起来了！

视觉Transformer BERT预训练新方法！中科大&MSRA等提出PeCo：卷起来了！

CVer

1+阅读 · 2021年12月7日

论文浅尝 | Multimodal Few-Shot Learning with Frozen Language Models

论文浅尝 | Multimodal Few-Shot Learning with Frozen Language Models

开放知识图谱

1+阅读 · 2021年9月23日

基于改进型视觉注意模型的多模态极相似图像检索方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

视觉注意机制下基于深度概率图模型的情感计算

国家自然科学基金

2+阅读 · 2013年12月31日

基于视觉注意机制的SAR图像小目标检测方法研究

国家自然科学基金

4+阅读 · 2013年12月31日

由二维图像序列重建三维图像中的融合与拼接方法研究

国家自然科学基金

0+阅读 · 2012年12月31日

基于视觉感知的图像分割评价方法研究

国家自然科学基金

1+阅读 · 2012年12月31日

基于视觉认知的图像不变特征提取

国家自然科学基金

0+阅读 · 2011年12月31日

基于黎曼空间模型的多模态Web图像流形学习及检索研究

国家自然科学基金

0+阅读 · 2011年12月31日

基于多通道体全息光学相关的遥感图像多维线/角位移测量技术

国家自然科学基金

0+阅读 · 2011年12月31日

基于语义的图像合成

国家自然科学基金

0+阅读 · 2011年12月31日

基于局部不变性特征流的相异场景密集匹配

国家自然科学基金

0+阅读 · 2011年12月31日

Fourier Image Transformer

Arxiv

2+阅读 · 2022年4月19日

Self-Calibrated Efficient Transformer for Lightweight Super-Resolution

Arxiv

1+阅读 · 2022年4月19日

VDTR: Video Deblurring with Transformer

Arxiv

0+阅读 · 2022年4月17日

Image Captioning In the Transformer Age

Arxiv

1+阅读 · 2022年4月15日

Transformers in Medical Image Analysis: A Review

Transformers in Medical Image Analysis: A Review

Arxiv

40+阅读 · 2022年2月24日

Transformers in Time Series: A Survey

Arxiv

34+阅读 · 2022年2月15日

A Survey of Transformers

Arxiv

103+阅读 · 2021年6月8日

Efficient Transformers: A Survey

Arxiv

23+阅读 · 2020年9月16日

CNN+CNN: Convolutional Decoders for Image Captioning

Arxiv

21+阅读 · 2018年5月23日

Image Captioning

Arxiv

11+阅读 · 2018年5月13日

VIP会员

相关主题

图像风格迁移

中科院自动化所

相关VIP内容

【CVPR2022】基于粗-精视觉Transformer的仿射医学图像配准

【CVPR2022】基于粗-精视觉Transformer的仿射医学图像配准

专知会员服务

36+阅读 · 2022年4月2日

【CVPR 2022】基于windows的图像压缩注意，The Devil Is in the Details: Window-based Attention for Image Compression

【CVPR 2022】基于windows的图像压缩注意，The Devil Is in the Details: Window-based Attention for Image Compression

专知会员服务

8+阅读 · 2022年3月12日

【CVPR 2022】自由风格的文本-人脸合成和操作，AnyFace: Free-style Text-to-Face Synthesis and Manipulation

【CVPR 2022】自由风格的文本-人脸合成和操作，AnyFace: Free-style Text-to-Face Synthesis and Manipulation

专知会员服务

8+阅读 · 2022年3月12日

[CVPR 2021] 序列到序列对比学习的文本识别

专知会员服务

14+阅读 · 2021年5月2日

【AAAI2021最佳论文】基于高效 Transformer 的长时间序列预测

【AAAI2021最佳论文】基于高效 Transformer 的长时间序列预测

专知会员服务

62+阅读 · 2021年2月6日

【CVPR2020】通过自适应GANs生成不同的图像，Diverse Image Generation via Self-Conditioned GANs

【CVPR2020】通过自适应GANs生成不同的图像，Diverse Image Generation via Self-Conditioned GANs

专知会员服务

34+阅读 · 2020年6月19日

新杀器来了！Facebook AI提出DETR：用Transformers来进行端到端的目标检测

新杀器来了！Facebook AI提出DETR：用Transformers来进行端到端的目标检测

专知会员服务

51+阅读 · 2020年5月28日

【CVPR2020】用于图像超分辨率的深度展开网络，Deep Unfolding Network for Image Super-Resolution

【CVPR2020】用于图像超分辨率的深度展开网络，Deep Unfolding Network for Image Super-Resolution

专知会员服务

44+阅读 · 2020年3月26日

必读的10篇 CVPR 2019【生成对抗网络】相关论文和代码

必读的10篇 CVPR 2019【生成对抗网络】相关论文和代码

专知会员服务

33+阅读 · 2020年1月10日

【字节跳动&Adobe】图割多模态风格迁移，Multimodal Style Transfer via Graph Cuts

【字节跳动&Adobe】图割多模态风格迁移，Multimodal Style Transfer via Graph Cuts

专知会员服务

15+阅读 · 2020年1月9日

热门VIP内容

开通专知VIP会员享更多权益服务

《乌克兰无人机产业：志愿者与政策在构建新兴无人机产业中的协同作用》最新报告

《人工智能辅助决策中的数据可视化：系统性综述》

人工智能驱动弹药制造现代化：美国陆军转型之路

《敏捷作战部署中枢纽-辐条基地选址优化研究》80页

相关资讯

CVPR 2022 Oral | MLP进军底层视觉！谷歌提出MAXIM：刷榜多个图像处理任务，代码已开源！

CVPR 2022 Oral | MLP进军底层视觉！谷歌提出MAXIM：刷榜多个图像处理任务，代码已开源！

CVer

0+阅读 · 2022年4月9日

一文看尽 CVPR 2022 最新 20 篇 Oral 论文

一文看尽 CVPR 2022 最新 20 篇 Oral 论文

极市平台

1+阅读 · 2022年4月8日

CVPR 2022｜快手&中科院开源StyTr^2：基于Transformer的图像风格化方法

CVPR 2022｜快手&中科院开源StyTr^2：基于Transformer的图像风格化方法

CVer

1+阅读 · 2022年4月8日

CVPR 2022｜快手联合中科院自动化所提出基于Transformer的图像风格化方法

CVPR 2022｜快手联合中科院自动化所提出基于Transformer的图像风格化方法

极市平台

0+阅读 · 2022年4月5日

CVPR 2022 | DualStyleGAN在手，百变风格我有！

CVPR 2022 | DualStyleGAN在手，百变风格我有！

CVer

2+阅读 · 2022年3月30日

CVPR 2022 | GeoTransformer：基于Transformer的点云配准网络

CVPR 2022 | GeoTransformer：基于Transformer的点云配准网络

PaperWeekly

2+阅读 · 2022年3月30日

谷歌提出MaskGIT：掩码生成图像Transformer

谷歌提出MaskGIT：掩码生成图像Transformer

CVer

2+阅读 · 2022年3月21日

超越Swin！MoA-Transformer：将全局特征聚合到视觉Transformer

超越Swin！MoA-Transformer：将全局特征聚合到视觉Transformer

CVer

2+阅读 · 2022年2月8日

视觉Transformer BERT预训练新方法！中科大&MSRA等提出PeCo：卷起来了！

视觉Transformer BERT预训练新方法！中科大&MSRA等提出PeCo：卷起来了！

CVer

1+阅读 · 2021年12月7日

论文浅尝 | Multimodal Few-Shot Learning with Frozen Language Models

论文浅尝 | Multimodal Few-Shot Learning with Frozen Language Models

开放知识图谱

1+阅读 · 2021年9月23日

相关基金

基于改进型视觉注意模型的多模态极相似图像检索方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

视觉注意机制下基于深度概率图模型的情感计算

国家自然科学基金

2+阅读 · 2013年12月31日

基于视觉注意机制的SAR图像小目标检测方法研究

国家自然科学基金

4+阅读 · 2013年12月31日

由二维图像序列重建三维图像中的融合与拼接方法研究

国家自然科学基金

0+阅读 · 2012年12月31日

基于视觉感知的图像分割评价方法研究

国家自然科学基金

1+阅读 · 2012年12月31日

基于视觉认知的图像不变特征提取

国家自然科学基金

0+阅读 · 2011年12月31日

基于黎曼空间模型的多模态Web图像流形学习及检索研究

国家自然科学基金

0+阅读 · 2011年12月31日

基于多通道体全息光学相关的遥感图像多维线/角位移测量技术

国家自然科学基金

0+阅读 · 2011年12月31日

基于语义的图像合成

国家自然科学基金

0+阅读 · 2011年12月31日

基于局部不变性特征流的相异场景密集匹配

国家自然科学基金

0+阅读 · 2011年12月31日

相关论文

Fourier Image Transformer

Arxiv

2+阅读 · 2022年4月19日

Self-Calibrated Efficient Transformer for Lightweight Super-Resolution

Arxiv

1+阅读 · 2022年4月19日

VDTR: Video Deblurring with Transformer

Arxiv

0+阅读 · 2022年4月17日

Image Captioning In the Transformer Age

Arxiv

1+阅读 · 2022年4月15日

Transformers in Medical Image Analysis: A Review

Transformers in Medical Image Analysis: A Review

Arxiv

40+阅读 · 2022年2月24日

Transformers in Time Series: A Survey

Arxiv

34+阅读 · 2022年2月15日

A Survey of Transformers

Arxiv

103+阅读 · 2021年6月8日

Efficient Transformers: A Survey

Arxiv

23+阅读 · 2020年9月16日

CNN+CNN: Convolutional Decoders for Image Captioning

Arxiv

21+阅读 · 2018年5月23日

Image Captioning

Arxiv

11+阅读 · 2018年5月13日

微信扫码咨询专知VIP会员