本文介绍了第一个用于文本到图像扩散模型中提示优化的基于梯度的框架。我们将提示工程表述为一个在语言空间中的离散优化问题。有效解决这个问题会遇到两个主要挑战:(1)庞大的域空间:将域设定为整个语言空间会对优化过程带来显著困难。(2)文本梯度:高效计算文本梯度具有挑战性,因为它需要通过扩散模型的推理步骤和不可微分的嵌入查找表进行反向传播。除了问题的表述外,我们的主要技术贡献在于解决上述挑战。首先,我们设计了一种动态生成的紧凑子空间家族,仅包含与用户输入最相关的词,大大限制了域空间。其次,我们引入了“快捷文本梯度”——一种可以在恒定内存和运行时间内获得的有效替代文本梯度的方法。对来自不同来源(DiffusionDB、ChatGPT、COCO)的提示进行的实证评估表明,我们的方法可以发现显著提高(提示增强)或破坏(对抗攻击)文本到图像扩散模型生成图像的真实性的提示。

https://arxiv.org/pdf/2407.01606

成为VIP会员查看完整内容
10

相关内容

【NeurIPS2022】分布式自适应元强化学习
专知会员服务
20+阅读 · 2022年10月8日
【CVPR2022】提示分布学习
专知会员服务
29+阅读 · 2022年5月17日
【NeurIPS2021】用于视频分割的密集无监督学习
专知会员服务
14+阅读 · 2021年11月14日
专知会员服务
11+阅读 · 2021年7月16日
【WWW2021】基于图层次相关性匹配信号的Ad-hoc 检索
专知会员服务
13+阅读 · 2021年2月25日
【AAAI2021】基于内容迁移的无监督领域自适应语义分割
专知会员服务
17+阅读 · 2020年12月25日
【ACMMM2020】零样本语义分割的上下文感知特征生成
专知会员服务
15+阅读 · 2020年8月21日
【AAAI2023】用于图对比学习的谱特征增强
专知
18+阅读 · 2022年12月11日
【CVPR2021】跨模态检索的概率嵌入
专知
17+阅读 · 2021年3月2日
【AAAI2021】自监督对应学习的对比转换
专知
12+阅读 · 2020年12月11日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
6+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Arxiv
144+阅读 · 2023年4月20日
A Survey of Large Language Models
Arxiv
353+阅读 · 2023年3月31日
Arxiv
59+阅读 · 2023年3月26日
Arxiv
125+阅读 · 2023年3月24日
Arxiv
18+阅读 · 2023年3月17日
VIP会员
相关VIP内容
【NeurIPS2022】分布式自适应元强化学习
专知会员服务
20+阅读 · 2022年10月8日
【CVPR2022】提示分布学习
专知会员服务
29+阅读 · 2022年5月17日
【NeurIPS2021】用于视频分割的密集无监督学习
专知会员服务
14+阅读 · 2021年11月14日
专知会员服务
11+阅读 · 2021年7月16日
【WWW2021】基于图层次相关性匹配信号的Ad-hoc 检索
专知会员服务
13+阅读 · 2021年2月25日
【AAAI2021】基于内容迁移的无监督领域自适应语义分割
专知会员服务
17+阅读 · 2020年12月25日
【ACMMM2020】零样本语义分割的上下文感知特征生成
专知会员服务
15+阅读 · 2020年8月21日
相关基金
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
6+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
微信扫码咨询专知VIP会员