本报告概述了开源视频生成模型的发展现状,重点介绍了当前流行的模型及其能力、扩展潜力以及面临的限制。视频生成模型在多个领域表现出强大的应用能力,尤其是在图像到视频(I2V)生成、多图像到视频、帧插值、视频到视频合成以及基于姿态的生成等方面。报告介绍了几种主要的开源模型,如Wan 2.2、Skyreels-V2、LTX和Mochi,并探讨了它们在视频生成中的优势和局限性。 此外,报告还详细阐述了扩展视频生成能力的方法,包括量化和卸载技术以提高模型的内存效率。尽管这些模型已取得显著进展,但仍面临着提示遵循、运动动态、视频持续时间等问题的挑战。通过分阶段处理,像SkyReels-V2这样的模型展示了如何在解决这些问题时取得突破。 报告最后通过几个实际应用示例,展示了这些视频生成模型在创作和研究中的潜力,鼓励用户探索新的视频效果和生成方法。