大模型生态加速突破，2024年应用元年有望到来 - 专知VIP

会员服务 ·

36

大模型 · 大语言模型 ·

2024 年 3 月 10 日

大模型生态加速突破，2024年应用元年有望到来

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

海外大语言模型进入新一轮大模型技术突破期，国内也纷纷突破GPT3.5水平　　国内外大语言模型进入新一轮突破期。在海外，OpenAI推出GPT-4V，多模态能力加强，Google推出新一轮大语言模型Gemini，其中Ultra模型在文本处理的基准测试优于GPT4，在2月15日，Google新发布了1.5版本相较于1.0的性能继续提升；Meta近期公布正在架构算力研发LLaMA3并坚持开源；Anthropic旗下的Claude模型也进化到3版本，整体性能略超GPT-4，继续保持长文本性能和安全性特点突出，大模型Mixtral通过MOE结构较好的提质增效。同期在国内包括智谱、文心一言、科大讯飞和通义千问等的新版本都达到了赶超GPT3.5甚至部分能力接近GPT4的水平。　　多模态生成大模型层出不穷，SORA引领新一轮大模型创新浪潮　　多模态生成大模型进入技术突破期，OpenAI发布视频生成模型SORA，采用Diffusion Transformer结构，使用时空Latent patch表示视频和图像，或成为模拟现实的基础；近期Stability.ai开源Stable Video Diffusion模型，Google发布VideoPoet，视频生成新技术不断涌现；文生图模型也逐步迭代，Midjourney推出V6版本，图片生成能力更加优异；此外在数字人领域，微软推出GAIA大模型，阿里巴巴推出Animate Anyone，我们认为这为垂类商业场景奠定了技术基础。　　应用与算力齐头并进，海外安迪比尔定律持续演绎　　除去大模型侧的创新，海外应用端在GPTs的带领下诞生了大量应用，2个月内就有超过300万应用创建，OpenAI还为此引入生态体系；在算力端，海外大厂的硬件投资依然持续，Meta在2024年有望继续扩大GPU投资，微软、google和Amazon都预计资本性支出在有望在新的一年继续扩大以支撑AI的投入。

成为VIP会员查看完整内容

61

相关内容

大模型

大模型是基于海量多源数据打造的预训练模型，是对原有算法模型的技术升级和产品迭代，用户可通过开源或开放API/工具等形式进行模型零样本/小样本数据学习，以实现更优的识别、理解、决策、生成效果和更低成本的开发部署方案。

科技专题研究：AI智算时代已至，算力芯片加速升级

科技专题研究：AI智算时代已至，算力芯片加速升级

专知会员服务

56+阅读 · 2024年1月13日

GPT-4-Turbo专题：多模态能力提升，应用生态加速

GPT-4-Turbo专题：多模态能力提升，应用生态加速

专知会员服务

72+阅读 · 2023年11月26日

人工智能行业专题：AI产业链分析与展望

人工智能行业专题：AI产业链分析与展望

专知会员服务

62+阅读 · 2023年8月24日

逐浪大模型，深度剖析互联网巨头的AI野望（附下载，68页）

逐浪大模型，深度剖析互联网巨头的AI野望（附下载，68页）

专知会员服务

77+阅读 · 2023年8月14日

【斯坦福博士论文】面向人机交互的语言模型设计与评估

【斯坦福博士论文】面向人机交互的语言模型设计与评估

专知会员服务

38+阅读 · 2023年7月9日

《工业机器人》深度报告，50页pdf：工业机器人国产化加速，寻找产业链强阿尔法

《工业机器人》深度报告，50页pdf：工业机器人国产化加速，寻找产业链强阿尔法

专知会员服务

38+阅读 · 2023年6月12日

【ChatGPT系列报告】国内大模型全面盘点：百度、阿里、腾讯、华为和字节跳动

【ChatGPT系列报告】国内大模型全面盘点：百度、阿里、腾讯、华为和字节跳动

专知会员服务

194+阅读 · 2023年4月20日

【ChatGPT系列报告】GPT-4专题-构建模型理解能力，商业落地未来可期

【ChatGPT系列报告】GPT-4专题-构建模型理解能力，商业落地未来可期

专知会员服务

103+阅读 · 2023年3月31日

现在大火的“In-context Learning”是什么？北大等最新《语境学习ICL》综述论文，详述ICL进展、挑战和方向

现在大火的“In-context Learning”是什么？北大等最新《语境学习ICL》综述论文，详述ICL进展、挑战和方向

专知会员服务

41+阅读 · 2023年1月3日

智能语音赛道：风口已至，全面开花

专知会员服务

38+阅读 · 2021年5月21日

ICCV 2019 开源论文 | 适用于视频分割的全新Attention机制

ICCV 2019 开源论文 | 适用于视频分割的全新Attention机制

PaperWeekly

10+阅读 · 2019年11月9日

【必读】2019年深度学习自然语言处理最新十大发展趋势, 附报告下载

【必读】2019年深度学习自然语言处理最新十大发展趋势, 附报告下载

专知

20+阅读 · 2019年10月13日

盘点当下大热的 7 大 Github 机器学习『创新』项目

盘点当下大热的 7 大 Github 机器学习『创新』项目

机器学习算法与Python学习

13+阅读 · 2019年9月20日

专访俞栋：多模态是迈向通用人工智能的重要方向

专访俞栋：多模态是迈向通用人工智能的重要方向

AI科技评论

26+阅读 · 2019年9月9日

100+前沿“拿来即用”开源深度学习模型汇总分享

100+前沿“拿来即用”开源深度学习模型汇总分享

深度学习与NLP

11+阅读 · 2019年8月29日

【AutoML干货】自动机器学习: 最新进展综述与开放挑战

【AutoML干货】自动机器学习: 最新进展综述与开放挑战

专知

25+阅读 · 2019年6月16日

【学界】CVPR 2019 Oral 目标跟踪最强算法SiamRPN++开源实现

【学界】CVPR 2019 Oral 目标跟踪最强算法SiamRPN++开源实现

GAN生成式对抗网络

16+阅读 · 2019年5月3日

牛逼哄哄的图卷积神经网络将带来哪些机遇？

牛逼哄哄的图卷积神经网络将带来哪些机遇？

计算机视觉life

49+阅读 · 2019年3月25日

AAAI 2019 | 云从科技联手上海交大提出端到端统一语义角色标注

AAAI 2019 | 云从科技联手上海交大提出端到端统一语义角色标注

机器之心

12+阅读 · 2019年2月19日

从人脸识别到行人重识别，下一个风口

从人脸识别到行人重识别，下一个风口

计算机视觉战队

13+阅读 · 2017年11月24日

基于三维激光测距的移动机器人室外环境语义地图构建

国家自然科学基金

2+阅读 · 2015年12月31日

适应于大数据特性的智能存储技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于云计算平台的下一代测序数据错误修正算法研究与实现

国家自然科学基金

2+阅读 · 2015年12月31日

云计算下的加密域多媒体水印与模式匹配

国家自然科学基金

1+阅读 · 2015年12月31日

大规模模糊RDF数据管理关键技术研究

国家自然科学基金

9+阅读 · 2015年12月31日

面向社交大数据的热点事件预测

国家自然科学基金

11+阅读 · 2015年12月31日

面向大数据的安全迁移学习方法

国家自然科学基金

29+阅读 · 2015年12月31日

关于面板(纵向）数据的动态统计分析

国家自然科学基金

0+阅读 · 2014年12月31日

超低待机功耗快速唤醒的微控制器关键技术研究

国家自然科学基金

1+阅读 · 2014年12月31日

海量Web用户生成内容物化关键技术

国家自然科学基金

2+阅读 · 2014年12月31日

Is ChatGPT a Good Recommender? A Preliminary Study

Arxiv

174+阅读 · 2023年4月20日

On Efficient Training of Large-Scale Deep Learning Models: A Literature Review

Arxiv

223+阅读 · 2023年4月7日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

494+阅读 · 2023年3月31日

A survey and taxonomy of loss functions in machine learning

Arxiv

27+阅读 · 2023年1月13日

Geometric multimodal representation learning

Arxiv

69+阅读 · 2022年9月7日

Graph Contrastive Learning with Adaptive Augmentation

Arxiv

10+阅读 · 2021年2月26日

Graph Neural Networks with Heterophily

Arxiv

19+阅读 · 2021年2月4日

Identity-aware Graph Neural Networks

Identity-aware Graph Neural Networks

Arxiv

14+阅读 · 2021年1月25日

How to train your MAML

Arxiv

26+阅读 · 2019年3月5日

Augmentation for small object detection

Augmentation for small object detection

Arxiv

13+阅读 · 2019年2月19日

VIP会员

相关主题

大语言模型

相关VIP内容

科技专题研究：AI智算时代已至，算力芯片加速升级

科技专题研究：AI智算时代已至，算力芯片加速升级

专知会员服务

56+阅读 · 2024年1月13日

GPT-4-Turbo专题：多模态能力提升，应用生态加速

GPT-4-Turbo专题：多模态能力提升，应用生态加速

专知会员服务

72+阅读 · 2023年11月26日

人工智能行业专题：AI产业链分析与展望

人工智能行业专题：AI产业链分析与展望

专知会员服务

62+阅读 · 2023年8月24日

逐浪大模型，深度剖析互联网巨头的AI野望（附下载，68页）

逐浪大模型，深度剖析互联网巨头的AI野望（附下载，68页）

专知会员服务

77+阅读 · 2023年8月14日

【斯坦福博士论文】面向人机交互的语言模型设计与评估

【斯坦福博士论文】面向人机交互的语言模型设计与评估

专知会员服务

38+阅读 · 2023年7月9日

《工业机器人》深度报告，50页pdf：工业机器人国产化加速，寻找产业链强阿尔法

《工业机器人》深度报告，50页pdf：工业机器人国产化加速，寻找产业链强阿尔法

专知会员服务

38+阅读 · 2023年6月12日

【ChatGPT系列报告】国内大模型全面盘点：百度、阿里、腾讯、华为和字节跳动

【ChatGPT系列报告】国内大模型全面盘点：百度、阿里、腾讯、华为和字节跳动

专知会员服务

194+阅读 · 2023年4月20日

【ChatGPT系列报告】GPT-4专题-构建模型理解能力，商业落地未来可期

【ChatGPT系列报告】GPT-4专题-构建模型理解能力，商业落地未来可期

专知会员服务

103+阅读 · 2023年3月31日

现在大火的“In-context Learning”是什么？北大等最新《语境学习ICL》综述论文，详述ICL进展、挑战和方向

现在大火的“In-context Learning”是什么？北大等最新《语境学习ICL》综述论文，详述ICL进展、挑战和方向

专知会员服务

41+阅读 · 2023年1月3日

智能语音赛道：风口已至，全面开花

专知会员服务

38+阅读 · 2021年5月21日

热门VIP内容

开通专知VIP会员享更多权益服务

【CMU博士论文】基础模型训练中网络规模数据的负责任与高效使用

《俄乌战争背景下俄罗斯的战略性海军分析（2022-2025年）》最新100页报告

人工智能时代背景下的未来海战

相关资讯

ICCV 2019 开源论文 | 适用于视频分割的全新Attention机制

ICCV 2019 开源论文 | 适用于视频分割的全新Attention机制

PaperWeekly

10+阅读 · 2019年11月9日

【必读】2019年深度学习自然语言处理最新十大发展趋势, 附报告下载

【必读】2019年深度学习自然语言处理最新十大发展趋势, 附报告下载

专知

20+阅读 · 2019年10月13日

盘点当下大热的 7 大 Github 机器学习『创新』项目

盘点当下大热的 7 大 Github 机器学习『创新』项目

机器学习算法与Python学习

13+阅读 · 2019年9月20日

专访俞栋：多模态是迈向通用人工智能的重要方向

专访俞栋：多模态是迈向通用人工智能的重要方向

AI科技评论

26+阅读 · 2019年9月9日

100+前沿“拿来即用”开源深度学习模型汇总分享

100+前沿“拿来即用”开源深度学习模型汇总分享

深度学习与NLP

11+阅读 · 2019年8月29日

【AutoML干货】自动机器学习: 最新进展综述与开放挑战

【AutoML干货】自动机器学习: 最新进展综述与开放挑战

专知

25+阅读 · 2019年6月16日

【学界】CVPR 2019 Oral 目标跟踪最强算法SiamRPN++开源实现

【学界】CVPR 2019 Oral 目标跟踪最强算法SiamRPN++开源实现

GAN生成式对抗网络

16+阅读 · 2019年5月3日

牛逼哄哄的图卷积神经网络将带来哪些机遇？

牛逼哄哄的图卷积神经网络将带来哪些机遇？

计算机视觉life

49+阅读 · 2019年3月25日

AAAI 2019 | 云从科技联手上海交大提出端到端统一语义角色标注

AAAI 2019 | 云从科技联手上海交大提出端到端统一语义角色标注

机器之心

12+阅读 · 2019年2月19日

从人脸识别到行人重识别，下一个风口

从人脸识别到行人重识别，下一个风口

计算机视觉战队

13+阅读 · 2017年11月24日

相关基金

基于三维激光测距的移动机器人室外环境语义地图构建

国家自然科学基金

2+阅读 · 2015年12月31日

适应于大数据特性的智能存储技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于云计算平台的下一代测序数据错误修正算法研究与实现

国家自然科学基金

2+阅读 · 2015年12月31日

云计算下的加密域多媒体水印与模式匹配

国家自然科学基金

1+阅读 · 2015年12月31日

大规模模糊RDF数据管理关键技术研究

国家自然科学基金

9+阅读 · 2015年12月31日

面向社交大数据的热点事件预测

国家自然科学基金

11+阅读 · 2015年12月31日

面向大数据的安全迁移学习方法

国家自然科学基金

29+阅读 · 2015年12月31日

关于面板(纵向）数据的动态统计分析

国家自然科学基金

0+阅读 · 2014年12月31日

超低待机功耗快速唤醒的微控制器关键技术研究

国家自然科学基金

1+阅读 · 2014年12月31日

海量Web用户生成内容物化关键技术

国家自然科学基金

2+阅读 · 2014年12月31日

相关论文

Is ChatGPT a Good Recommender? A Preliminary Study

Arxiv

174+阅读 · 2023年4月20日

On Efficient Training of Large-Scale Deep Learning Models: A Literature Review

Arxiv

223+阅读 · 2023年4月7日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

494+阅读 · 2023年3月31日

A survey and taxonomy of loss functions in machine learning

Arxiv

27+阅读 · 2023年1月13日

Geometric multimodal representation learning

Arxiv

69+阅读 · 2022年9月7日

Graph Contrastive Learning with Adaptive Augmentation

Arxiv

10+阅读 · 2021年2月26日

Graph Neural Networks with Heterophily

Arxiv

19+阅读 · 2021年2月4日

Identity-aware Graph Neural Networks

Identity-aware Graph Neural Networks

Arxiv

14+阅读 · 2021年1月25日

How to train your MAML

Arxiv

26+阅读 · 2019年3月5日

Augmentation for small object detection

Augmentation for small object detection

Arxiv

13+阅读 · 2019年2月19日

微信扫码咨询专知VIP会员