站在当下,本报告研究AI+视频的意义:技术和产品迭代升级较快导致目前市场大多数报告无时效性,且往往缺少对产品的实际测试以及对相同提示词的比较分析,而AI视频生成正成为当前AI产业发展的关键节点。视频杂糅了文本、语音、图像等多维度内容,其训练的难点也往往在于视频数据对数量和质量的不足、算法架构需要优化、物理规律性较差等等,但随着AI+视频的技术和产品升级迭代,众多行业有望受益,诸如电影、广告、视频剪辑、视频流媒体平台、UGC创作平台、短视频综合平台等,而目前正处在AI+视频发展的关键性时刻。 市场主流的AI视频生成技术迭代路径经历了早期的GAN+VAE、Transformer、Diffusion Model以及Sora采用的DiT架构(Transformer+Diffusion),技术迭代升级带来视频处理质量上的飞跃性提升。VAE引入了隐变量推断,GAN生成的图像真实清晰,VAE+GAN的串联融合可以实现数据的自动生成+高质量图像生成;Transformer在并处处理、长时间序列数据处理、多注意力处理上有着强大的优势,通过预训练和微调可提高模型性能;扩散模型可解释性强,可生成高质量图像和视频;李飞飞联合谷歌研发的WALT视频大模型将图像和视频编码到共享潜在空间中。Sora采用的DiT架构有效进行结合,利用Transformer处理潜在空间中的图像数据块,模拟数据的扩散过程以生成时长更长、质量更高的图像和视频。 我们认为,国内AI+视频产品单条价格低于海外产品,其中RunwayGen-3Alpha和快手可灵为目前AI视频生成的全球第一梯队,在视频分辨率、生成速度、物体符合物理规律、提示词理解、视频时长等诸多维度上表现均较为优秀。核心梳理国内和海外市场AI视频生成的核心参与者,如海外Luma AI(Dream Machine)、Runway(Gen1-2&Gen-3Alpha)、Pika、Sora,国内快手可灵、美图、PixVerse、剪映即梦、清华Vidu、七火山Etna等,集中梳理了众多产品的融资历程、产品迭代、核心功能、实测效果比较等多方面。经过我们测算,目前AI+视频主流产品的单条视频生成价格分别为:Luma AI0.16美元(1.17rmb)、Pika0.05美元(0.364rmb)、Runway0.48美元(3.49rmb)、快手可灵0.5rmb、字节剪映即梦0.04rmb、爱诗科技Pixverse V2为0.02美元(0.174rmb)、美图WHEE为0.32rmb,国内AI+视频产品单条价格较低,质量不差。 不止于视频生成,从AI生成到AI工作流,一站式AI视频生成+剪辑+故事创作有望成为产业核心发展方向。目前,AI+视频大多数用于创意内容生成,直接用于ToB商业化较少。追溯原因,首先生成视频的人物一致性、所需时长、画面质量尚且不满足立即商业化水准。其次,我们发现目前主流AI视频工具还处在视频生成竞争的阶段,且大多数为单一功能产品。在视频生成之后,诸如准确的提示词生成、修改视频片段、添加字幕、脚本生成、转场衔接、背景音乐添加等众多细节功能暂未集成,因此现今阶段还需要多种不同的视频创作工具串联使用才能达到直接输出可商业化视频的效果,环节繁琐、多工具之间的格式也可能存在不兼容的可能性,给用户带来使用上的不便。因此我们认为,后续需要持续关注能够一站式提供视频生成+编辑等功能的企业,了解用户痛点,打磨产品细节,才能真正将技术用于生产工作、娱乐等众多环节,带来商业化变现的潜在空间。一站式AI视频生成&剪辑&UGC创作有望解决市场一直在质疑的“AI+视频没有实质作用问题”。 AI+视频时代来临,思考哪类公司存在商业化变现的可能性?我们认为,1)一站式平台型公司,如Adobe、美图公司;2)AI+视频技术头部服务商转型产品类公司,如Runway、商汤科技;3)视频剪辑类公司,如快手;4)广告营销类公司,如易点天下、蓝色光标、因赛集团、利欧股份;5)UGC社区类公司,如Bilibili;6)视频数据类公司,如捷成股份、华策影视、视觉中国、中广天择;7)IP类公司,如上海电影、阅文集团、汤姆猫、中文在线、果麦文化;8)探索AI视频工作流及其他创作方向类公司,如博纳影业、超讯通信、柠萌影视。9)其他建议关注猫眼娱乐、光线传媒、芒果超媒、万达电影等。