【CVPR2023】基于图像特定提示学习的零样本生成模型自适应 - 专知VIP

会员服务 ·

15

CVPR 2023 · 提示学习 · 图像合成 · AIGC ·

2023 年 4 月 7 日

【CVPR2023】基于图像特定提示学习的零样本生成模型自适应

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

最近，CLIP引导的图像合成在将预训练的源域生成器适应于未见过的目标域方面表现出了诱人的性能。它不需要任何目标域样本，只需要文本域标签。训练是非常高效的，例如，几分钟。然而，现有方法在生成图像的质量方面仍然存在一定的局限性，并且可能会出现模式崩溃的问题。一个关键的原因是对所有的跨域图像对应用固定的自适应方向，从而导致相同的监督信号。为了解决这个问题，本文提出了一种图像特定提示学习(image -specific Prompt Learning, IPL)方法，为每个源域图像学习特定的提示向量。为每个跨域图像对生成一个更精确的自适应方向，使目标域生成器具有更大的灵活性。不同领域的定性和定量评估表明，IPL有效地提高了合成图像的质量和多样性，缓解了模式崩溃。此外，IPL独立于生成模型的结构，如生成对抗网络或扩散模型。代码可以在https://github.com/Picsart-AI-Research/IPLZero-Shot-Generative-Model-Adaptation上找到。

成为VIP会员查看完整内容

31

相关内容

CVPR 2023

CVPR 2023大会将于 6 月 18 日至 22 日在温哥华会议中心举行。CVPR是IEEE Conference on Computer Vision and Pattern Recognition的缩写，即IEEE国际计算机视觉与模式识别会议。该会议是由IEEE举办的计算机视觉和模式识别领域的顶级会议，会议的主要内容是计算机视觉与模式识别技术。 CVPR 2023 共收到 9155 份提交，比去年增加了 12%，创下新纪录，今年接收了 2360 篇论文，接收率为 25.78%。作为对比，去年有 8100 多篇有效投稿，大会接收了 2067 篇，接收率为 25%。

【CVPR2023】提示、生成、然后缓存:基础模型的级联生成强大的少样本学习器

【CVPR2023】提示、生成、然后缓存:基础模型的级联生成强大的少样本学习器

专知会员服务

37+阅读 · 2023年3月8日

【南洋理工-CVPR2022】视觉语言模型的条件提示学习

【南洋理工-CVPR2022】视觉语言模型的条件提示学习

专知会员服务

34+阅读 · 2022年3月13日

【AAAI2022】用于视觉常识推理的场景图增强图像-文本学习

【AAAI2022】用于视觉常识推理的场景图增强图像-文本学习

专知会员服务

50+阅读 · 2021年12月20日

【ICML2021】学习一个通用模板的少样本数据集泛化

专知会员服务

26+阅读 · 2021年5月23日

【CVPR2021】基于跨领域自适应聚类的半监督领域自适应算法

专知会员服务

58+阅读 · 2021年5月19日

【CVPR2021】面向通用领域自适应的领域共识聚类

专知会员服务

30+阅读 · 2021年5月6日

【CVPR2021】背景鲁棒的自监督视频表征学习

【CVPR2021】背景鲁棒的自监督视频表征学习

专知会员服务

17+阅读 · 2021年3月13日

【IJCAI2020】通过双向对抗训练生成中间域样本提升半监督域自适应效果

【IJCAI2020】通过双向对抗训练生成中间域样本提升半监督域自适应效果

专知会员服务

35+阅读 · 2020年9月17日

【CVPR2020】通过自适应GANs生成不同的图像，Diverse Image Generation via Self-Conditioned GANs

【CVPR2020】通过自适应GANs生成不同的图像，Diverse Image Generation via Self-Conditioned GANs

专知会员服务

34+阅读 · 2020年6月19日

【CVPR2020-Facebook AI】单样本自适应域脸生成，One-Shot Domain Adaptation

【CVPR2020-Facebook AI】单样本自适应域脸生成，One-Shot Domain Adaptation

专知会员服务

29+阅读 · 2020年4月6日

【CVPR2023】Vita-CLIP:通过多模态提示的视频和文本自适应CLIP

【CVPR2023】Vita-CLIP:通过多模态提示的视频和文本自适应CLIP

专知

5+阅读 · 2023年4月11日

IJCAI 2022 | 使用陈述句进行视觉问答的Prompt Tuning

IJCAI 2022 | 使用陈述句进行视觉问答的Prompt Tuning

PaperWeekly

3+阅读 · 2022年9月21日

NAACL 2022 | 基于Prompt的文本生成迁移学习

NAACL 2022 | 基于Prompt的文本生成迁移学习

PaperWeekly

1+阅读 · 2022年8月31日

CVPR 2022 | 元学习在图像回归任务的表现

CVPR 2022 | 元学习在图像回归任务的表现

PaperWeekly

1+阅读 · 2022年6月11日

CVPR 2022 | 基于序列对比学习的长视频逐帧动作表示

CVPR 2022 | 基于序列对比学习的长视频逐帧动作表示

PaperWeekly

1+阅读 · 2022年6月9日

论文浅尝 | P-Adapters: 从具有不同提示的语言模型中鲁棒地提取事实信息

论文浅尝 | P-Adapters: 从具有不同提示的语言模型中鲁棒地提取事实信息

开放知识图谱

1+阅读 · 2022年6月8日

NAACL 2022 | FACTPEGASUS：抽象摘要的真实性感知预训练和微调

NAACL 2022 | FACTPEGASUS：抽象摘要的真实性感知预训练和微调

PaperWeekly

0+阅读 · 2022年6月1日

【CVPR2021】面向通用领域自适应的领域共识聚类

【CVPR2021】面向通用领域自适应的领域共识聚类

专知

24+阅读 · 2021年5月6日

【CVPR2021】半监督迁移学习的自适应一致性正则化

【CVPR2021】半监督迁移学习的自适应一致性正则化

专知

41+阅读 · 2021年3月7日

ICCV 2019 最佳论文《SinGAN：从单张自然图像学习生成式模型》中文全译

ICCV 2019 最佳论文《SinGAN：从单张自然图像学习生成式模型》中文全译

AI科技评论

11+阅读 · 2019年10月30日

基于自学习对比度视觉注意模型和自适应深度特征的无分类目标检测

国家自然科学基金

2+阅读 · 2015年12月31日

结构化矢量图的模式样本合成与操控

国家自然科学基金

0+阅读 · 2013年12月31日

基于多尺度结构特征和图模型的异源图像配准

国家自然科学基金

0+阅读 · 2013年12月31日

基于概念背景图的网络爬虫语义协作与竞争策略研究

国家自然科学基金

0+阅读 · 2012年12月31日

基于数据与模型混合驱动的密集人群中特定人脸持续跟踪方法

国家自然科学基金

0+阅读 · 2012年12月31日

基于语义多边图的多物体图像类别发现及其在图像检索中的应用

国家自然科学基金

0+阅读 · 2012年12月31日

基于结构稀疏模型的高光谱影像亚像元级分类和超分辨率制图技术研究

国家自然科学基金

0+阅读 · 2012年12月31日

基于自适应分级稀疏模型的鲁棒目标跟踪研究

国家自然科学基金

0+阅读 · 2012年12月31日

基于语义的图像合成

国家自然科学基金

0+阅读 · 2011年12月31日

寡糖类抗癌疫苗衍生物的酶法合成

国家自然科学基金

0+阅读 · 2008年12月31日

Improving Zero-shot Generalization and Robustness of Multi-modal Models

Improving Zero-shot Generalization and Robustness of Multi-modal Models

Arxiv

0+阅读 · 2023年5月25日

Towards Adaptive Prefix Tuning for Parameter-Efficient Language Model Fine-tuning

Arxiv

0+阅读 · 2023年5月24日

Pre-training Multi-task Contrastive Learning Models for Scientific Literature Understanding

Arxiv

0+阅读 · 2023年5月23日

A Perspectival Mirror of the Elephant: Investigating Language Bias on Google, ChatGPT, Wikipedia, and YouTube

Arxiv

0+阅读 · 2023年5月23日

NeuralField-LDM: Scene Generation with Hierarchical Latent Diffusion Models

Arxiv

42+阅读 · 2023年4月19日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

494+阅读 · 2023年3月31日

Data-Free Knowledge Transfer: A Survey

Arxiv

21+阅读 · 2021年12月31日

Survey: Transformer based Video-Language Pre-training

Arxiv

20+阅读 · 2021年9月21日

Learning from Few Samples: A Survey

Learning from Few Samples: A Survey

Arxiv

77+阅读 · 2020年7月30日

A Survey of Domain Adaptation for Neural Machine Translation

Arxiv

18+阅读 · 2018年6月1日

VIP会员

相关主题

相关VIP内容

【CVPR2023】提示、生成、然后缓存:基础模型的级联生成强大的少样本学习器

【CVPR2023】提示、生成、然后缓存:基础模型的级联生成强大的少样本学习器

专知会员服务

37+阅读 · 2023年3月8日

【南洋理工-CVPR2022】视觉语言模型的条件提示学习

【南洋理工-CVPR2022】视觉语言模型的条件提示学习

专知会员服务

34+阅读 · 2022年3月13日

【AAAI2022】用于视觉常识推理的场景图增强图像-文本学习

【AAAI2022】用于视觉常识推理的场景图增强图像-文本学习

专知会员服务

50+阅读 · 2021年12月20日

【ICML2021】学习一个通用模板的少样本数据集泛化

专知会员服务

26+阅读 · 2021年5月23日

【CVPR2021】基于跨领域自适应聚类的半监督领域自适应算法

专知会员服务

58+阅读 · 2021年5月19日

【CVPR2021】面向通用领域自适应的领域共识聚类

专知会员服务

30+阅读 · 2021年5月6日

【CVPR2021】背景鲁棒的自监督视频表征学习

【CVPR2021】背景鲁棒的自监督视频表征学习

专知会员服务

17+阅读 · 2021年3月13日

【IJCAI2020】通过双向对抗训练生成中间域样本提升半监督域自适应效果

【IJCAI2020】通过双向对抗训练生成中间域样本提升半监督域自适应效果

专知会员服务

35+阅读 · 2020年9月17日

【CVPR2020】通过自适应GANs生成不同的图像，Diverse Image Generation via Self-Conditioned GANs

【CVPR2020】通过自适应GANs生成不同的图像，Diverse Image Generation via Self-Conditioned GANs

专知会员服务

34+阅读 · 2020年6月19日

【CVPR2020-Facebook AI】单样本自适应域脸生成，One-Shot Domain Adaptation

【CVPR2020-Facebook AI】单样本自适应域脸生成，One-Shot Domain Adaptation

专知会员服务

29+阅读 · 2020年4月6日

热门VIP内容

开通专知VIP会员享更多权益服务

大语言模型智能体强化学习：全景综述

《城市滨海地区：理解复杂多变环境下的指挥控制框架》50页报告

【伯克利博士论文】从推理服务到训练：面向大规模 LLM 智能体的高效系统

美空军“顶点2025”实验：推进AI在C2、动态目标锁定与联盟集成中的应用

相关资讯

【CVPR2023】Vita-CLIP:通过多模态提示的视频和文本自适应CLIP

【CVPR2023】Vita-CLIP:通过多模态提示的视频和文本自适应CLIP

专知

5+阅读 · 2023年4月11日

IJCAI 2022 | 使用陈述句进行视觉问答的Prompt Tuning

IJCAI 2022 | 使用陈述句进行视觉问答的Prompt Tuning

PaperWeekly

3+阅读 · 2022年9月21日

NAACL 2022 | 基于Prompt的文本生成迁移学习

NAACL 2022 | 基于Prompt的文本生成迁移学习

PaperWeekly

1+阅读 · 2022年8月31日

CVPR 2022 | 元学习在图像回归任务的表现

CVPR 2022 | 元学习在图像回归任务的表现

PaperWeekly

1+阅读 · 2022年6月11日

CVPR 2022 | 基于序列对比学习的长视频逐帧动作表示

CVPR 2022 | 基于序列对比学习的长视频逐帧动作表示

PaperWeekly

1+阅读 · 2022年6月9日

论文浅尝 | P-Adapters: 从具有不同提示的语言模型中鲁棒地提取事实信息

论文浅尝 | P-Adapters: 从具有不同提示的语言模型中鲁棒地提取事实信息

开放知识图谱

1+阅读 · 2022年6月8日

NAACL 2022 | FACTPEGASUS：抽象摘要的真实性感知预训练和微调

NAACL 2022 | FACTPEGASUS：抽象摘要的真实性感知预训练和微调

PaperWeekly

0+阅读 · 2022年6月1日

【CVPR2021】面向通用领域自适应的领域共识聚类

【CVPR2021】面向通用领域自适应的领域共识聚类

专知

24+阅读 · 2021年5月6日

【CVPR2021】半监督迁移学习的自适应一致性正则化

【CVPR2021】半监督迁移学习的自适应一致性正则化

专知

41+阅读 · 2021年3月7日

ICCV 2019 最佳论文《SinGAN：从单张自然图像学习生成式模型》中文全译

ICCV 2019 最佳论文《SinGAN：从单张自然图像学习生成式模型》中文全译

AI科技评论

11+阅读 · 2019年10月30日

相关基金

基于自学习对比度视觉注意模型和自适应深度特征的无分类目标检测

国家自然科学基金

2+阅读 · 2015年12月31日

结构化矢量图的模式样本合成与操控

国家自然科学基金

0+阅读 · 2013年12月31日

基于多尺度结构特征和图模型的异源图像配准

国家自然科学基金

0+阅读 · 2013年12月31日

基于概念背景图的网络爬虫语义协作与竞争策略研究

国家自然科学基金

0+阅读 · 2012年12月31日

基于数据与模型混合驱动的密集人群中特定人脸持续跟踪方法

国家自然科学基金

0+阅读 · 2012年12月31日

基于语义多边图的多物体图像类别发现及其在图像检索中的应用

国家自然科学基金

0+阅读 · 2012年12月31日

基于结构稀疏模型的高光谱影像亚像元级分类和超分辨率制图技术研究

国家自然科学基金

0+阅读 · 2012年12月31日

基于自适应分级稀疏模型的鲁棒目标跟踪研究

国家自然科学基金

0+阅读 · 2012年12月31日

基于语义的图像合成

国家自然科学基金

0+阅读 · 2011年12月31日

寡糖类抗癌疫苗衍生物的酶法合成

国家自然科学基金

0+阅读 · 2008年12月31日

相关论文

Improving Zero-shot Generalization and Robustness of Multi-modal Models

Improving Zero-shot Generalization and Robustness of Multi-modal Models

Arxiv

0+阅读 · 2023年5月25日

Towards Adaptive Prefix Tuning for Parameter-Efficient Language Model Fine-tuning

Arxiv

0+阅读 · 2023年5月24日

Pre-training Multi-task Contrastive Learning Models for Scientific Literature Understanding

Arxiv

0+阅读 · 2023年5月23日

A Perspectival Mirror of the Elephant: Investigating Language Bias on Google, ChatGPT, Wikipedia, and YouTube

Arxiv

0+阅读 · 2023年5月23日

NeuralField-LDM: Scene Generation with Hierarchical Latent Diffusion Models

Arxiv

42+阅读 · 2023年4月19日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

494+阅读 · 2023年3月31日

Data-Free Knowledge Transfer: A Survey

Arxiv

21+阅读 · 2021年12月31日

Survey: Transformer based Video-Language Pre-training

Arxiv

20+阅读 · 2021年9月21日

Learning from Few Samples: A Survey

Learning from Few Samples: A Survey

Arxiv

77+阅读 · 2020年7月30日

A Survey of Domain Adaptation for Neural Machine Translation

Arxiv

18+阅读 · 2018年6月1日

微信扫码咨询专知VIP会员