大规模文本到图像扩散模型,如DALL-E 2,Imagen和Stable Diffusion,在文本到图像生成任务上取得了相当大的成功。然而,它们仅提供有限的灵活性和可控性,仅通过文本进行条件控制,对最终用户来说有所不足。为了提高这种自由度,我们需要更好地调整生成过程的方法。本演讲将讨论一些最有前景和有效的方法,用于控制文本到图像扩散模型。这些方法将包括训练时和推断时技术的混合应用。

成为VIP会员查看完整内容
30

相关内容

【ICRA2022】机器人强化学习工具教程, 附slides与视频
专知会员服务
39+阅读 · 2022年5月27日
专知会员服务
21+阅读 · 2021年8月10日
【芝加哥大学】可变形的风格转移,Deformable Style Transfer
专知会员服务
30+阅读 · 2020年3月26日
国家自然科学基金
0+阅读 · 2017年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
25+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Arxiv
157+阅读 · 2023年4月20日
A Survey of Large Language Models
Arxiv
398+阅读 · 2023年3月31日
Arxiv
139+阅读 · 2023年3月24日
VIP会员
相关基金
国家自然科学基金
0+阅读 · 2017年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
25+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
微信扫码咨询专知VIP会员