海外大语言模型进入新一轮大模型技术突破期,国内也纷纷突破GPT3.5水平  国内外大语言模型进入新一轮突破期。在海外,OpenAI推出GPT-4V,多模态能力加强,Google推出新一轮大语言模型Gemini,其中Ultra模型在文本处理的基准测试优于GPT4,在2月15日,Google新发布了1.5版本相较于1.0的性能继续提升;Meta近期公布正在架构算力研发LLaMA3并坚持开源;Anthropic旗下的Claude模型也进化到3版本,整体性能略超GPT-4,继续保持长文本性能和安全性特点突出,大模型Mixtral通过MOE结构较好的提质增效。同期在国内包括智谱、文心一言、科大讯飞和通义千问等的新版本都达到了赶超GPT3.5甚至部分能力接近GPT4的水平。  多模态生成大模型层出不穷,SORA引领新一轮大模型创新浪潮  多模态生成大模型进入技术突破期,OpenAI发布视频生成模型SORA,采用Diffusion Transformer结构,使用时空Latent patch表示视频和图像,或成为模拟现实的基础;近期Stability.ai开源Stable Video Diffusion模型,Google发布VideoPoet,视频生成新技术不断涌现;文生图模型也逐步迭代,Midjourney推出V6版本,图片生成能力更加优异;此外在数字人领域,微软推出GAIA大模型,阿里巴巴推出Animate Anyone,我们认为这为垂类商业场景奠定了技术基础。  应用与算力齐头并进,海外安迪比尔定律持续演绎  除去大模型侧的创新,海外应用端在GPTs的带领下诞生了大量应用,2个月内就有超过300万应用创建,OpenAI还为此引入生态体系;在算力端,海外大厂的硬件投资依然持续,Meta在2024年有望继续扩大GPU投资,微软、google和Amazon都预计资本性支出在有望在新的一年继续扩大以支撑AI的投入。

成为VIP会员查看完整内容
59

相关内容

大模型是基于海量多源数据打造的预训练模型,是对原有算法模型的技术升级和产品迭代,用户可通过开源或开放API/工具等形式进行模型零样本/小样本数据学习,以实现更优的识别、理解、决策、生成效果和更低成本的开发部署方案。
GPT-4-Turbo专题:多模态能力提升,应用生态加速
专知会员服务
70+阅读 · 2023年11月26日
人工智能行业专题:AI产业链分析与展望
专知会员服务
61+阅读 · 2023年8月24日
专知会员服务
36+阅读 · 2021年5月21日
盘点当下大热的 7 大 Github 机器学习『创新』项目
机器学习算法与Python学习
12+阅读 · 2019年9月20日
专访俞栋:多模态是迈向通用人工智能的重要方向
AI科技评论
24+阅读 · 2019年9月9日
100+前沿“拿来即用”开源深度学习模型汇总分享
深度学习与NLP
11+阅读 · 2019年8月29日
【学界】CVPR 2019 Oral 目标跟踪最强算法SiamRPN++开源实现
GAN生成式对抗网络
16+阅读 · 2019年5月3日
牛逼哄哄的图卷积神经网络将带来哪些机遇?
计算机视觉life
49+阅读 · 2019年3月25日
从人脸识别到行人重识别,下一个风口
计算机视觉战队
13+阅读 · 2017年11月24日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
9+阅读 · 2015年12月31日
国家自然科学基金
25+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
Arxiv
157+阅读 · 2023年4月20日
A Survey of Large Language Models
Arxiv
400+阅读 · 2023年3月31日
Arxiv
68+阅读 · 2022年9月7日
Arxiv
10+阅读 · 2021年2月26日
Arxiv
19+阅读 · 2021年2月4日
Identity-aware Graph Neural Networks
Arxiv
14+阅读 · 2021年1月25日
Arxiv
26+阅读 · 2019年3月5日
Augmentation for small object detection
Arxiv
11+阅读 · 2019年2月19日
VIP会员
相关资讯
盘点当下大热的 7 大 Github 机器学习『创新』项目
机器学习算法与Python学习
12+阅读 · 2019年9月20日
专访俞栋:多模态是迈向通用人工智能的重要方向
AI科技评论
24+阅读 · 2019年9月9日
100+前沿“拿来即用”开源深度学习模型汇总分享
深度学习与NLP
11+阅读 · 2019年8月29日
【学界】CVPR 2019 Oral 目标跟踪最强算法SiamRPN++开源实现
GAN生成式对抗网络
16+阅读 · 2019年5月3日
牛逼哄哄的图卷积神经网络将带来哪些机遇?
计算机视觉life
49+阅读 · 2019年3月25日
从人脸识别到行人重识别,下一个风口
计算机视觉战队
13+阅读 · 2017年11月24日
相关基金
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
9+阅读 · 2015年12月31日
国家自然科学基金
25+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
相关论文
Arxiv
157+阅读 · 2023年4月20日
A Survey of Large Language Models
Arxiv
400+阅读 · 2023年3月31日
Arxiv
68+阅读 · 2022年9月7日
Arxiv
10+阅读 · 2021年2月26日
Arxiv
19+阅读 · 2021年2月4日
Identity-aware Graph Neural Networks
Arxiv
14+阅读 · 2021年1月25日
Arxiv
26+阅读 · 2019年3月5日
Augmentation for small object detection
Arxiv
11+阅读 · 2019年2月19日
微信扫码咨询专知VIP会员