视频大模型迎来Sora时刻,生产力工具蓄势待发。自Sora发布以来,国内外已有十多家公司发布或更新视频生成模型。   客观对比:与Sora差距缩小,抢占用户或为未来主线。国内外之间的差距正在逐步缩小,视频时长、分辨率等基础功能具有复制性,未来竞争或向抢占用户、提升粘性等方向迁移,从而需要保障生成质量更高的可用视频,使得视频一致性更高、文本指令遵循更准确、物理真实模拟能力更强。   主观对比:视频质量提升显著,离物理世界模拟器仍有距离。文生视频领域,视频画面普遍清晰,而在动作幅度与物理还原度方面差异较大,我国Vidu、清影或已处于视频生成大模型第一梯队,生成时间相对其他模型倍数减少,且在动作幅度、物理还原度等复杂任务完成性较好;图生视频领域,整体效果优于文生视频,国内与国外差距进一步缩小。   视频大模型具备商用潜力,下游应用正在储能。未来随着用户习惯的培育以及算力基础设施的完善,视频大模型的或者办公、广告、电影、游戏等多领域具有广阔的前景。   算法、算力、数据三要素,视频大模型通往AGI的必经之路。   算法:视频生成模型算法主要由基于SD逐帧生成和基于时空Patches两种范式构成,是效率与效益的比拼。前者模型更容易训练,而视频内容一致性要差一些,长视频训练存在困难;后者训练成本更高,但是生成视频的长度与一致性更容易得到保障。   算力:以Sora为例,一定条件下测算,Sora训练算力需求是GPT-4的4.5倍,而推理算力需求接近GPT-4的400倍。   数据:高质量数据是模型能力的保障,而用户数量或为开启模型迭代“数据飞轮”的关键。

成为VIP会员查看完整内容
21

相关内容

AI大模型赋能手机终端,拥抱AI手机新机遇
专知会员服务
30+阅读 · 7月4日
AI进化加速端侧落地,新一轮换机潮蓄势待发
专知会员服务
34+阅读 · 6月21日
具身智能:突破人机边界,AI产业的下一站
专知会员服务
67+阅读 · 5月18日
海外模型应用复盘:国内AI奇点已至,80页ppt
专知会员服务
104+阅读 · 2023年10月29日
AI大模型赋能千行百业(附下载,117页)
专知会员服务
170+阅读 · 2023年7月20日
AI时代投资逻辑
专知会员服务
48+阅读 · 2023年7月6日
视频文本预训练简述
专知会员服务
19+阅读 · 2022年7月24日
专知会员服务
36+阅读 · 2021年5月21日
图说报告 | “智能+”的终极版图:数字孪生世界
人工智能学家
22+阅读 · 2019年8月20日
BERT系列文章汇总导读
AINLP
12+阅读 · 2019年8月19日
视频目标识别资源集合
专知
25+阅读 · 2019年6月15日
基于姿态的人物视频生成【附PPT与视频资料】
人工智能前沿讲习班
32+阅读 · 2019年1月28日
开年重磅——彭宇新团队综述与展望多媒体内容理解
计算机研究与发展
14+阅读 · 2019年1月22日
精品教材-《Grokking深度学习》分享
深度学习与NLP
12+阅读 · 2019年1月19日
【重磅】100大产业链全景图
全球创新论坛
11+阅读 · 2018年12月3日
独家揭秘腾讯研发效能体系 | 活动通知
DevOps时代
21+阅读 · 2018年10月24日
GIS最新热点以及未来发展热门
人工智能学家
10+阅读 · 2018年3月29日
【团队新作】深度强化学习进展: 从AlphaGo到AlphaGo Zero
中国科学院自动化研究所
16+阅读 · 2018年1月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
29+阅读 · 2014年12月31日
Arxiv
148+阅读 · 2023年4月20日
A Survey of Large Language Models
Arxiv
374+阅读 · 2023年3月31日
Arxiv
132+阅读 · 2023年3月24日
Arxiv
19+阅读 · 2023年3月17日
Neural Architecture Search without Training
Arxiv
10+阅读 · 2021年6月11日
已删除
Arxiv
31+阅读 · 2020年3月23日
Arxiv
26+阅读 · 2019年3月5日
VIP会员
相关主题
相关VIP内容
AI大模型赋能手机终端,拥抱AI手机新机遇
专知会员服务
30+阅读 · 7月4日
AI进化加速端侧落地,新一轮换机潮蓄势待发
专知会员服务
34+阅读 · 6月21日
具身智能:突破人机边界,AI产业的下一站
专知会员服务
67+阅读 · 5月18日
海外模型应用复盘:国内AI奇点已至,80页ppt
专知会员服务
104+阅读 · 2023年10月29日
AI大模型赋能千行百业(附下载,117页)
专知会员服务
170+阅读 · 2023年7月20日
AI时代投资逻辑
专知会员服务
48+阅读 · 2023年7月6日
视频文本预训练简述
专知会员服务
19+阅读 · 2022年7月24日
专知会员服务
36+阅读 · 2021年5月21日
相关资讯
图说报告 | “智能+”的终极版图:数字孪生世界
人工智能学家
22+阅读 · 2019年8月20日
BERT系列文章汇总导读
AINLP
12+阅读 · 2019年8月19日
视频目标识别资源集合
专知
25+阅读 · 2019年6月15日
基于姿态的人物视频生成【附PPT与视频资料】
人工智能前沿讲习班
32+阅读 · 2019年1月28日
开年重磅——彭宇新团队综述与展望多媒体内容理解
计算机研究与发展
14+阅读 · 2019年1月22日
精品教材-《Grokking深度学习》分享
深度学习与NLP
12+阅读 · 2019年1月19日
【重磅】100大产业链全景图
全球创新论坛
11+阅读 · 2018年12月3日
独家揭秘腾讯研发效能体系 | 活动通知
DevOps时代
21+阅读 · 2018年10月24日
GIS最新热点以及未来发展热门
人工智能学家
10+阅读 · 2018年3月29日
【团队新作】深度强化学习进展: 从AlphaGo到AlphaGo Zero
中国科学院自动化研究所
16+阅读 · 2018年1月31日
相关基金
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
29+阅读 · 2014年12月31日
相关论文
Arxiv
148+阅读 · 2023年4月20日
A Survey of Large Language Models
Arxiv
374+阅读 · 2023年3月31日
Arxiv
132+阅读 · 2023年3月24日
Arxiv
19+阅读 · 2023年3月17日
Neural Architecture Search without Training
Arxiv
10+阅读 · 2021年6月11日
已删除
Arxiv
31+阅读 · 2020年3月23日
Arxiv
26+阅读 · 2019年3月5日
微信扫码咨询专知VIP会员