Controllability is a fundamental requirement in video synthesis, where accurate alignment with conditioning signals is essential. Existing classifier-free guidance methods typically achieve conditioning indirectly by modeling the joint distribution of data and conditions, which often results in limited controllability over the specified conditions. Classifier-based guidance enforces conditions through an external classifier, but the model may exploit this mechanism to raise the classifier score without genuinely satisfying the intended condition, resulting in adversarial artifacts and limited effective controllability. In this paper, we propose Attention-Conditional Diffusion (ACD), a novel framework for direct conditional control in video diffusion models via attention supervision. By aligning the model's attention maps with external control signals, ACD achieves better controllability. To support this, we introduce a sparse 3D-aware object layout as an efficient conditioning signal, along with a dedicated Layout ControlNet and an automated annotation pipeline for scalable layout integration. Extensive experiments on benchmark video generation datasets demonstrate that ACD delivers superior alignment with conditioning inputs while preserving temporal coherence and visual fidelity, establishing an effective paradigm for conditional video synthesis.


翻译:可控性是视频合成的核心要求,其关键在于生成内容与条件信号的精确对齐。现有的无分类器引导方法通常通过对数据与条件的联合分布进行建模来间接实现条件控制,这往往导致对特定条件的可控性有限。基于分类器的引导方法通过外部分类器强制执行条件,但模型可能利用该机制仅提升分类器分数而非真正满足预期条件,从而产生对抗性伪影并限制有效可控性。本文提出注意力条件扩散(ACD),一种通过注意力监督实现视频扩散模型直接条件控制的新框架。通过将模型的注意力图与外部控制信号对齐,ACD实现了更优的可控性。为此,我们引入稀疏三维感知物体布局作为高效条件信号,并设计了专用布局控制网络(Layout ControlNet)及自动化标注流程以实现可扩展的布局集成。在基准视频生成数据集上的大量实验表明,ACD在保持时间连贯性与视觉保真度的同时,能够实现与条件输入的卓越对齐,为条件视频合成建立了有效范式。

0
下载
关闭预览

相关内容

Python图像处理,366页pdf,Image Operators Image Processing in Python
NAACL 2019 | 一种考虑缓和KL消失的简单VAE训练方法
PaperWeekly
20+阅读 · 2019年4月24日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
VIP会员
相关基金
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员