重磅！Lehigh微软最新《Sora:综述大视觉模型的背景、技术、限制和机遇》报告 - 专知VIP

会员服务 ·

30

Sora · 视频生成模型 · 视觉 ·

2024 年 3 月 1 日

重磅！Lehigh微软最新《Sora:综述大视觉模型的背景、技术、限制和机遇》报告

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

Sora是一个文本到视频的生成式AI模型，由OpenAI在2024年2月发布。该模型被训练用于从文本指令生成现实或想象场景的视频，并展示了在模拟物理世界方面的潜力。基于公开的技术报告和逆向工程，本文对该模型的背景、相关技术、应用、现存挑战以及文本到视频AI模型的未来发展方向进行了全面综述。我们首先追溯Sora的发展，并研究用于构建这个“世界模拟器”的底层技术。然后，我们详细描述了Sora在从电影制作和教育到营销等多个行业的应用及潜在影响。我们讨论了需要解决的主要挑战和限制，以广泛部署Sora，例如确保安全且无偏见的视频生成。最后，我们讨论了Sora和一般视频生成模型的未来发展，以及该领域的进步如何能够启用新的人工智能交互方式，提升视频生成的生产力和创造力。

成为VIP会员查看完整内容

61

相关内容

Sora

Sora是OpenAI发布的一个AI模型，可以从文本指令中创建现实和想象的视频。OpenAI发布首个文本生成视频模型Sora，在生成视频长度（60秒）和内容上表现突出，为AIGC发展过程中的一大里程碑事件，

重磅！新书《多智能体强化学习：基础与现代方法》完整版，爱丁堡Stefano博士编著，385页pdf

重磅！新书《多智能体强化学习：基础与现代方法》完整版，爱丁堡Stefano博士编著，385页pdf

专知会员服务

132+阅读 · 2023年11月1日

【普林斯顿博士论文】生成式人工智能的承诺与陷阱：以AI安全为中心的方法

【普林斯顿博士论文】生成式人工智能的承诺与陷阱：以AI安全为中心的方法

专知会员服务

48+阅读 · 2023年7月23日

如何构建CV中的AGI？华为最新《计算机视觉中的人工通用智能：从GPT和大型语言模型中学到的经验教训》

如何构建CV中的AGI？华为最新《计算机视觉中的人工通用智能：从GPT和大型语言模型中学到的经验教训》

专知会员服务

57+阅读 · 2023年6月21日

推荐！《基于人工智能的学习、优化和兵棋推演（LAILOW）来实现美国海军作战兵力的战略部署和分布》2023最新14页报告

推荐！《基于人工智能的学习、优化和兵棋推演（LAILOW）来实现美国海军作战兵力的战略部署和分布》2023最新14页报告

专知会员服务

73+阅读 · 2023年5月31日

重磅！新书《多智能体强化学习：基础与现代方法》最新版，爱丁堡Stefano博士编著，320页pdf

重磅！新书《多智能体强化学习：基础与现代方法》最新版，爱丁堡Stefano博士编著，320页pdf

专知会员服务

175+阅读 · 2023年5月30日

【2023新书】生成深度学习：教机器绘画、写作、作曲和游戏第二版

【2023新书】生成深度学习：教机器绘画、写作、作曲和游戏第二版

专知会员服务

153+阅读 · 2023年5月14日

重磅！人大等最新《大模型》综述，51页pdf详述大型语言模型进展

重磅！人大等最新《大模型》综述，51页pdf详述大型语言模型进展

专知会员服务

369+阅读 · 2023年4月3日

【2024新书】深度学习的数学工程，The Mathematical Engineering of Deep Learning

【2024新书】深度学习的数学工程，The Mathematical Engineering of Deep Learning

专知会员服务

154+阅读 · 2022年4月11日

【AI+军事】北约技术报告《基于内容的多媒体分析 (CBMA)》（附下载）

【AI+军事】北约技术报告《基于内容的多媒体分析 (CBMA)》（附下载）

专知会员服务

42+阅读 · 2022年3月28日

重磅！70+位作者272页pdf《预测：理论与实践》，概述预测体系

重磅！70+位作者272页pdf《预测：理论与实践》，概述预测体系

专知会员服务

61+阅读 · 2022年3月13日

【2022新书】使用Scikit-Learn、Keras和TensorFlow实践机器学习:构建智能系统的概念、工具和技术第三版

【2022新书】使用Scikit-Learn、Keras和TensorFlow实践机器学习:构建智能系统的概念、工具和技术第三版

专知

15+阅读 · 2022年11月8日

推荐！《军事元宇宙作战概念（CONOPS）》【完整译文】2022最新13页技术报告，北约科学和技术组织（STO）

推荐！《军事元宇宙作战概念（CONOPS）》【完整译文】2022最新13页技术报告，北约科学和技术组织（STO）

专知

13+阅读 · 2022年10月15日

【2022新书】深度学习的数学工程，The Mathematical Engineering of Deep Learning

【2022新书】深度学习的数学工程，The Mathematical Engineering of Deep Learning

专知

29+阅读 · 2022年4月12日

AACL2020最新《可解释人工智能与自然语言处理可解释性》教程，附159页ppt与视频

AACL2020最新《可解释人工智能与自然语言处理可解释性》教程，附159页ppt与视频

专知

25+阅读 · 2020年12月6日

NeurIPS提前看 | 四篇论文，一窥元学习的最新研究进展

NeurIPS提前看 | 四篇论文，一窥元学习的最新研究进展

机器之心

12+阅读 · 2019年12月9日

ICCV 2019 开源论文 | 适用于视频分割的全新Attention机制

ICCV 2019 开源论文 | 适用于视频分割的全新Attention机制

PaperWeekly

10+阅读 · 2019年11月9日

重磅发布：基于 PyTorch 的深度文本匹配工具 MatchZoo-py

重磅发布：基于 PyTorch 的深度文本匹配工具 MatchZoo-py

中国科学院网络数据重点实验室

16+阅读 · 2019年8月26日

收藏 | Tensorflow实现的深度NLP模型集锦（附资源）

收藏 | Tensorflow实现的深度NLP模型集锦（附资源）

THU数据派

12+阅读 · 2019年4月28日

Github 项目推荐 | 论文的代码实现：可变形ConvNets v2的PyTorch实现

Github 项目推荐 | 论文的代码实现：可变形ConvNets v2的PyTorch实现

AI研习社

22+阅读 · 2019年1月10日

AI前沿学生论坛 | 朱时超：图神经网络模型及应用进展【附视频+PPT下载】

AI前沿学生论坛 | 朱时超：图神经网络模型及应用进展【附视频+PPT下载】

人工智能前沿讲习班

18+阅读 · 2018年9月25日

核心化算法中的新技术研究

国家自然科学基金

8+阅读 · 2017年12月31日

基于深度学习的复杂退化模糊图像恢复

国家自然科学基金

5+阅读 · 2015年12月31日

基于负调查的云数据隐私保护关键问题研究

国家自然科学基金

1+阅读 · 2015年12月31日

面向Bug报告的软件故障重现方法研究

国家自然科学基金

4+阅读 · 2015年12月31日

GNSS仿真模型服务化共享关键技术研究

国家自然科学基金

9+阅读 · 2015年12月31日

基于人类3D视觉感应的2D到3D视频转换关键技术研究

国家自然科学基金

2+阅读 · 2015年12月31日

面向大数据的安全迁移学习方法

国家自然科学基金

29+阅读 · 2015年12月31日

可证明的网络和数据匿名性及隐私增强身份管理关键技术研究

国家自然科学基金

3+阅读 · 2014年12月31日

Biot模型基于有限元离散的多重网格算法研究

国家自然科学基金

1+阅读 · 2014年12月31日

海量Web用户生成内容物化关键技术

国家自然科学基金

2+阅读 · 2014年12月31日

Is ChatGPT a Good Recommender? A Preliminary Study

Arxiv

174+阅读 · 2023年4月20日

A Comprehensive Survey on Deep Graph Representation Learning

Arxiv

106+阅读 · 2023年4月11日

On Efficient Training of Large-Scale Deep Learning Models: A Literature Review

Arxiv

223+阅读 · 2023年4月7日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

494+阅读 · 2023年3月31日

Unleashing the Power of Edge-Cloud Generative AI in Mobile Networks: A Survey of AIGC Services

Arxiv

152+阅读 · 2023年3月29日

Sparks of Artificial General Intelligence: Early experiments with GPT-4

Arxiv

51+阅读 · 2023年3月22日

Large-scale Multi-Modal Pre-trained Models: A Comprehensive Survey

Arxiv

25+阅读 · 2023年2月20日

Deep Face Recognition: A Survey

Deep Face Recognition: A Survey

Arxiv

18+阅读 · 2019年2月12日

Deep learning in agriculture: A survey

Arxiv

11+阅读 · 2018年7月31日

Event Extraction with Generative Adversarial Imitation Learning

Arxiv

13+阅读 · 2018年4月21日

VIP会员

相关主题

视频生成模型

相关VIP内容

重磅！新书《多智能体强化学习：基础与现代方法》完整版，爱丁堡Stefano博士编著，385页pdf

重磅！新书《多智能体强化学习：基础与现代方法》完整版，爱丁堡Stefano博士编著，385页pdf

专知会员服务

132+阅读 · 2023年11月1日

【普林斯顿博士论文】生成式人工智能的承诺与陷阱：以AI安全为中心的方法

【普林斯顿博士论文】生成式人工智能的承诺与陷阱：以AI安全为中心的方法

专知会员服务

48+阅读 · 2023年7月23日

如何构建CV中的AGI？华为最新《计算机视觉中的人工通用智能：从GPT和大型语言模型中学到的经验教训》

如何构建CV中的AGI？华为最新《计算机视觉中的人工通用智能：从GPT和大型语言模型中学到的经验教训》

专知会员服务

57+阅读 · 2023年6月21日

推荐！《基于人工智能的学习、优化和兵棋推演（LAILOW）来实现美国海军作战兵力的战略部署和分布》2023最新14页报告

推荐！《基于人工智能的学习、优化和兵棋推演（LAILOW）来实现美国海军作战兵力的战略部署和分布》2023最新14页报告

专知会员服务

73+阅读 · 2023年5月31日

重磅！新书《多智能体强化学习：基础与现代方法》最新版，爱丁堡Stefano博士编著，320页pdf

重磅！新书《多智能体强化学习：基础与现代方法》最新版，爱丁堡Stefano博士编著，320页pdf

专知会员服务

175+阅读 · 2023年5月30日

【2023新书】生成深度学习：教机器绘画、写作、作曲和游戏第二版

【2023新书】生成深度学习：教机器绘画、写作、作曲和游戏第二版

专知会员服务

153+阅读 · 2023年5月14日

重磅！人大等最新《大模型》综述，51页pdf详述大型语言模型进展

重磅！人大等最新《大模型》综述，51页pdf详述大型语言模型进展

专知会员服务

369+阅读 · 2023年4月3日

【2024新书】深度学习的数学工程，The Mathematical Engineering of Deep Learning

【2024新书】深度学习的数学工程，The Mathematical Engineering of Deep Learning

专知会员服务

154+阅读 · 2022年4月11日

【AI+军事】北约技术报告《基于内容的多媒体分析 (CBMA)》（附下载）

【AI+军事】北约技术报告《基于内容的多媒体分析 (CBMA)》（附下载）

专知会员服务

42+阅读 · 2022年3月28日

重磅！70+位作者272页pdf《预测：理论与实践》，概述预测体系

重磅！70+位作者272页pdf《预测：理论与实践》，概述预测体系

专知会员服务

61+阅读 · 2022年3月13日

热门VIP内容

开通专知VIP会员享更多权益服务

《代码、指挥与冲突：描绘军事人工智能的未来》报告

【斯坦福博士论文】面向地理空间数据的多模态与多尺度建模：时空生成式人工智能

美国启动“自有军事人工智能计划”：采用谷歌Gemini以推动全军人工智能应用

《创新与适应性作为军事成功的关键因素：来自俄乌战争的战略洞见》报告

相关资讯

【2022新书】使用Scikit-Learn、Keras和TensorFlow实践机器学习:构建智能系统的概念、工具和技术第三版

【2022新书】使用Scikit-Learn、Keras和TensorFlow实践机器学习:构建智能系统的概念、工具和技术第三版

专知

15+阅读 · 2022年11月8日

推荐！《军事元宇宙作战概念（CONOPS）》【完整译文】2022最新13页技术报告，北约科学和技术组织（STO）

推荐！《军事元宇宙作战概念（CONOPS）》【完整译文】2022最新13页技术报告，北约科学和技术组织（STO）

专知

13+阅读 · 2022年10月15日

【2022新书】深度学习的数学工程，The Mathematical Engineering of Deep Learning

【2022新书】深度学习的数学工程，The Mathematical Engineering of Deep Learning

专知

29+阅读 · 2022年4月12日

AACL2020最新《可解释人工智能与自然语言处理可解释性》教程，附159页ppt与视频

AACL2020最新《可解释人工智能与自然语言处理可解释性》教程，附159页ppt与视频

专知

25+阅读 · 2020年12月6日

NeurIPS提前看 | 四篇论文，一窥元学习的最新研究进展

NeurIPS提前看 | 四篇论文，一窥元学习的最新研究进展

机器之心

12+阅读 · 2019年12月9日

ICCV 2019 开源论文 | 适用于视频分割的全新Attention机制

ICCV 2019 开源论文 | 适用于视频分割的全新Attention机制

PaperWeekly

10+阅读 · 2019年11月9日

重磅发布：基于 PyTorch 的深度文本匹配工具 MatchZoo-py

重磅发布：基于 PyTorch 的深度文本匹配工具 MatchZoo-py

中国科学院网络数据重点实验室

16+阅读 · 2019年8月26日

收藏 | Tensorflow实现的深度NLP模型集锦（附资源）

收藏 | Tensorflow实现的深度NLP模型集锦（附资源）

THU数据派

12+阅读 · 2019年4月28日

Github 项目推荐 | 论文的代码实现：可变形ConvNets v2的PyTorch实现

Github 项目推荐 | 论文的代码实现：可变形ConvNets v2的PyTorch实现

AI研习社

22+阅读 · 2019年1月10日

AI前沿学生论坛 | 朱时超：图神经网络模型及应用进展【附视频+PPT下载】

AI前沿学生论坛 | 朱时超：图神经网络模型及应用进展【附视频+PPT下载】

人工智能前沿讲习班

18+阅读 · 2018年9月25日

相关基金

核心化算法中的新技术研究

国家自然科学基金

8+阅读 · 2017年12月31日

基于深度学习的复杂退化模糊图像恢复

国家自然科学基金

5+阅读 · 2015年12月31日

基于负调查的云数据隐私保护关键问题研究

国家自然科学基金

1+阅读 · 2015年12月31日

面向Bug报告的软件故障重现方法研究

国家自然科学基金

4+阅读 · 2015年12月31日

GNSS仿真模型服务化共享关键技术研究

国家自然科学基金

9+阅读 · 2015年12月31日

基于人类3D视觉感应的2D到3D视频转换关键技术研究

国家自然科学基金

2+阅读 · 2015年12月31日

面向大数据的安全迁移学习方法

国家自然科学基金

29+阅读 · 2015年12月31日

可证明的网络和数据匿名性及隐私增强身份管理关键技术研究

国家自然科学基金

3+阅读 · 2014年12月31日

Biot模型基于有限元离散的多重网格算法研究

国家自然科学基金

1+阅读 · 2014年12月31日

海量Web用户生成内容物化关键技术

国家自然科学基金

2+阅读 · 2014年12月31日

相关论文

Is ChatGPT a Good Recommender? A Preliminary Study

Arxiv

174+阅读 · 2023年4月20日

A Comprehensive Survey on Deep Graph Representation Learning

Arxiv

106+阅读 · 2023年4月11日

On Efficient Training of Large-Scale Deep Learning Models: A Literature Review

Arxiv

223+阅读 · 2023年4月7日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

494+阅读 · 2023年3月31日

Unleashing the Power of Edge-Cloud Generative AI in Mobile Networks: A Survey of AIGC Services

Arxiv

152+阅读 · 2023年3月29日

Sparks of Artificial General Intelligence: Early experiments with GPT-4

Arxiv

51+阅读 · 2023年3月22日

Large-scale Multi-Modal Pre-trained Models: A Comprehensive Survey

Arxiv

25+阅读 · 2023年2月20日

Deep Face Recognition: A Survey

Deep Face Recognition: A Survey

Arxiv

18+阅读 · 2019年2月12日

Deep learning in agriculture: A survey

Arxiv

11+阅读 · 2018年7月31日

Event Extraction with Generative Adversarial Imitation Learning

Arxiv

13+阅读 · 2018年4月21日

微信扫码咨询专知VIP会员