Visual storytelling requires generating multi-shot videos with cinematic quality and long-range consistency. Inspired by human memory, we propose StoryMem, a paradigm that reformulates long-form video storytelling as iterative shot synthesis conditioned on explicit visual memory, transforming pre-trained single-shot video diffusion models into multi-shot storytellers. This is achieved by a novel Memory-to-Video (M2V) design, which maintains a compact and dynamically updated memory bank of keyframes from historical generated shots. The stored memory is then injected into single-shot video diffusion models via latent concatenation and negative RoPE shifts with only LoRA fine-tuning. A semantic keyframe selection strategy, together with aesthetic preference filtering, further ensures informative and stable memory throughout generation. Moreover, the proposed framework naturally accommodates smooth shot transitions and customized story generation applications. To facilitate evaluation, we introduce ST-Bench, a diverse benchmark for multi-shot video storytelling. Extensive experiments demonstrate that StoryMem achieves superior cross-shot consistency over previous methods while preserving high aesthetic quality and prompt adherence, marking a significant step toward coherent minute-long video storytelling.


翻译:视觉叙事需要生成具有电影级质量和长程一致性的多镜头视频。受人类记忆机制启发,我们提出StoryMem范式,将长视频叙事重构为基于显式视觉记忆的迭代镜头合成,将预训练的单镜头视频扩散模型转化为多镜头叙事生成器。该范式通过新颖的记忆到视频(M2V)设计实现,该设计维护着由历史生成镜头关键帧构成的紧凑动态记忆库。存储的记忆通过潜在空间拼接和负向RoPE偏移注入单镜头视频扩散模型,仅需LoRA微调。结合语义关键帧选择策略与审美偏好过滤机制,进一步确保生成过程中记忆的信息丰富性和稳定性。此外,所提框架天然支持平滑镜头转场和定制化故事生成应用。为促进评估,我们提出了ST-Bench——一个多样化的多镜头视频叙事基准测试集。大量实验表明,StoryMem在保持高审美质量和提示遵从性的同时,实现了优于现有方法的跨镜头一致性,标志着向连贯分钟级视频叙事迈出了重要一步。

0
下载
关闭预览

相关内容

【NeurIPS2023】多样化的时空感知用于视频域泛化
专知会员服务
21+阅读 · 2023年10月30日
DeepMind:用PopArt进行多任务深度强化学习
论智
29+阅读 · 2018年9月14日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
46+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
VIP会员
相关基金
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
46+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
Top
微信扫码咨询专知VIP会员