生成式基座大模型正在引发人工智能领域的重大变革,在自然语言处理、多模态理解与内容合成等任务展现通用能力。大模型部署于云侧提供通用智能服务,但面临时延大、个性化不足等关键挑战,小模型部署于端侧捕捉个性化场景数据,但存在泛化性不足的难题。大小模型端云协同技术旨在结合大模型通用能力和小模型专用能力,以协同交互方式学习演化进而赋能下游垂直行业场景。本文以大语言模型和多模态大模型为代表,梳理生成式基座大模型的主流架构、典型预训练技术和适配微调等方法,介绍在大模型背景下模型剪枝、模型量化和知识蒸馏等大模型小型化关键技术的发展历史和研究近况,依据模型间协作目的及协同原理异同,提出大小模型协同训练、协同推理和协同规划的协同进化分类方法,概述端云模型双向蒸馏、模块化设计和生成式智能体等系列代表性新技术、新思路。总体而言,本文从生成式基座大模型、大模型小型化技术和大小模型端云协同方式3个方面探讨大小模型协同进化的国际和国内发展现状,对比优势和差距,并从应用前景、模型架构设计、垂直领域模型融合、个性化和安全可信挑战等层面分析基座赋能发展趋势。

成为VIP会员查看完整内容
1

相关内容

图数据管理与图机器学习:协同效应与机会
专知会员服务
15+阅读 · 2月5日
多智能体协作机制:大语言模型综述
专知会员服务
59+阅读 · 1月14日
无人机边缘计算: 架构、多址接入与计算卸载
专知会员服务
33+阅读 · 2024年9月16日
图对抗防御研究进展
专知会员服务
39+阅读 · 2021年12月13日
专知会员服务
33+阅读 · 2021年7月25日
专知会员服务
73+阅读 · 2021年7月21日
专知会员服务
19+阅读 · 2021年7月20日
图计算加速架构综述
专知会员服务
51+阅读 · 2021年4月5日
专知会员服务
18+阅读 · 2020年11月8日
面向多智能体博弈对抗的对手建模框架
专知
16+阅读 · 2022年9月28日
数据受限条件下的多模态处理技术综述
专知
20+阅读 · 2022年7月16日
综述| 当图神经网络遇上强化学习
图与推荐
34+阅读 · 2022年7月1日
硬件加速神经网络综述
计算机研究与发展
26+阅读 · 2019年2月1日
深度学习与计算机视觉任务应用综述
深度学习与NLP
50+阅读 · 2018年12月18日
无人机集群、蜂群与蜂群算法
无人机
92+阅读 · 2018年9月25日
深度学习之CNN简介
Python技术博文
20+阅读 · 2018年1月10日
深度 | 一文概览图卷积网络基本结构和最新进展
机器之心
17+阅读 · 2017年11月30日
从浅层模型到深度模型:概览机器学习优化算法
机器之心
27+阅读 · 2017年7月9日
大数据分析研究组开源Easy Machine Learning系统
中国科学院网络数据重点实验室
17+阅读 · 2017年6月13日
国家自然科学基金
0+阅读 · 2017年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
6+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
28+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
Arxiv
170+阅读 · 2023年4月20日
A Survey of Large Language Models
Arxiv
467+阅读 · 2023年3月31日
Arxiv
24+阅读 · 2023年3月17日
Arxiv
68+阅读 · 2022年9月7日
VIP会员
相关VIP内容
图数据管理与图机器学习:协同效应与机会
专知会员服务
15+阅读 · 2月5日
多智能体协作机制:大语言模型综述
专知会员服务
59+阅读 · 1月14日
无人机边缘计算: 架构、多址接入与计算卸载
专知会员服务
33+阅读 · 2024年9月16日
图对抗防御研究进展
专知会员服务
39+阅读 · 2021年12月13日
专知会员服务
33+阅读 · 2021年7月25日
专知会员服务
73+阅读 · 2021年7月21日
专知会员服务
19+阅读 · 2021年7月20日
图计算加速架构综述
专知会员服务
51+阅读 · 2021年4月5日
专知会员服务
18+阅读 · 2020年11月8日
相关资讯
面向多智能体博弈对抗的对手建模框架
专知
16+阅读 · 2022年9月28日
数据受限条件下的多模态处理技术综述
专知
20+阅读 · 2022年7月16日
综述| 当图神经网络遇上强化学习
图与推荐
34+阅读 · 2022年7月1日
硬件加速神经网络综述
计算机研究与发展
26+阅读 · 2019年2月1日
深度学习与计算机视觉任务应用综述
深度学习与NLP
50+阅读 · 2018年12月18日
无人机集群、蜂群与蜂群算法
无人机
92+阅读 · 2018年9月25日
深度学习之CNN简介
Python技术博文
20+阅读 · 2018年1月10日
深度 | 一文概览图卷积网络基本结构和最新进展
机器之心
17+阅读 · 2017年11月30日
从浅层模型到深度模型:概览机器学习优化算法
机器之心
27+阅读 · 2017年7月9日
大数据分析研究组开源Easy Machine Learning系统
中国科学院网络数据重点实验室
17+阅读 · 2017年6月13日
相关基金
国家自然科学基金
0+阅读 · 2017年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
6+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
28+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
微信扫码咨询专知VIP会员