大模型是“大算力+强算法”相结合的产物,是人工智能的发展趋势和未来。目前,大规模的生态已初具规模,可以实现从“手工作坊”到“工厂模式”的AI 转型。大模型通常在大规模无标记数据上进行训练,以学习某种特征和规则。基于大模型开发应用时,可以通过大模型微调,完成多个应用场景的任务;大模型具有多模态信息处理能力,相比传统机器学习方式,能更高效地分析各行业数据,展现出更加强大的应用潜力;更重要的是,大模型具有自监督学习能力,不需要或很少需要人工标注数据进行训练,降低训练成本,从而可以加快 AI 产业化进程,降低 AI 应用门槛。当前,互联网厂商、AI 厂商、以及一些初创公司都接连推出了各自的大模型产品。

一方面,大型科技公司密集发布自研大模型,从算力层、平台层、模型层、应用层进行了四位一体的全面布局,涌现出华为云盘古大模型、百度文心一言、阿里云通义千问、科大讯飞星火认知等一批具有行业影响力的预训练大模型。

另一方面,国内各大高校与科研院所也在积极布局大模型,清华大学发布 ChatGLM,复旦大学推出国内首个类ChatGPT 大模型 MOSS。各大模型在服务业、工业、金融业已经开始落地应用。然而,当前大模型应用系统能力指标不明确、性能要求、测试方法不统一等标准化需求突出,为引导行业高质量发展,亟需统一的评测方法。 在上述背景下,本标准聚焦大模型评测体系,从大模型构建过程和应用过程出发综合考虑能力要求,同时还将着重归纳、总结和梳理目前大模型应用比较好的服务业、金融、医疗、制造业、交通、教育等行业的应用过程特点、评估实践和未来趋势,以保障标准内容的适用性、可行性和覆盖性。 制定《人工智能 预训练模型 第 2 部分:评测指标与方法》国家标准有助于不同类型的企业基于规范化、统一的能力和性能指标、测试数据、测试工具、测试环境和测试方法进行大模型评测与应用指导。

本文件规定了预训练模型评测内容、指标设置和评测方法。 本文件适用于模型提供者、应用服务者和应用消费者等对预训练模型能力进行评估与测试,也可以为预训练模型的设计、开发、应用提供参考。

成为VIP会员查看完整内容
78

相关内容

国家标准(national standard)是「由国家标准机构通过并公开发布的标准。」
国家标准《人工智能深度学习算法评估》(征求意见稿)
《用于军用车辆探测的零样本多模态深度学习模型》
专知会员服务
34+阅读 · 2024年5月9日
《大型语言模型持续学习》综述
专知会员服务
82+阅读 · 2024年4月26日
《生成式人工智能模型:机遇与风险》
专知会员服务
73+阅读 · 2024年4月22日
智能集群系统的强化学习方法综述
专知会员服务
78+阅读 · 2024年1月1日
多模态预训练模型综述
专知会员服务
89+阅读 · 2023年11月20日
大模型如何赋能医学?全科医学人工智能基础模型
专知会员服务
85+阅读 · 2023年4月13日
基于模型的强化学习综述
专知
33+阅读 · 2022年7月13日
清华大学《高级机器学习》课程
专知
39+阅读 · 2020年7月21日
【KDD2020】图神经网络生成式预训练
专知
22+阅读 · 2020年7月3日
零样本图像识别综述论文
专知
21+阅读 · 2020年4月4日
多模态深度学习综述,18页pdf
专知
48+阅读 · 2020年3月29日
实战 | 基于深度学习模型VGG的图像识别(附代码)
七月在线实验室
12+阅读 · 2018年3月30日
大数据分析研究组开源Easy Machine Learning系统
中国科学院网络数据重点实验室
16+阅读 · 2017年6月13日
国家自然科学基金
8+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
8+阅读 · 2015年12月31日
国家自然科学基金
6+阅读 · 2015年12月31日
国家自然科学基金
27+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
15+阅读 · 2013年12月31日
国家自然科学基金
17+阅读 · 2008年12月31日
Arxiv
162+阅读 · 2023年4月20日
A Survey of Large Language Models
Arxiv
424+阅读 · 2023年3月31日
Arxiv
153+阅读 · 2023年3月24日
Arxiv
22+阅读 · 2023年3月17日
VIP会员
相关VIP内容
国家标准《人工智能深度学习算法评估》(征求意见稿)
《用于军用车辆探测的零样本多模态深度学习模型》
专知会员服务
34+阅读 · 2024年5月9日
《大型语言模型持续学习》综述
专知会员服务
82+阅读 · 2024年4月26日
《生成式人工智能模型:机遇与风险》
专知会员服务
73+阅读 · 2024年4月22日
智能集群系统的强化学习方法综述
专知会员服务
78+阅读 · 2024年1月1日
多模态预训练模型综述
专知会员服务
89+阅读 · 2023年11月20日
大模型如何赋能医学?全科医学人工智能基础模型
专知会员服务
85+阅读 · 2023年4月13日
相关资讯
基于模型的强化学习综述
专知
33+阅读 · 2022年7月13日
清华大学《高级机器学习》课程
专知
39+阅读 · 2020年7月21日
【KDD2020】图神经网络生成式预训练
专知
22+阅读 · 2020年7月3日
零样本图像识别综述论文
专知
21+阅读 · 2020年4月4日
多模态深度学习综述,18页pdf
专知
48+阅读 · 2020年3月29日
实战 | 基于深度学习模型VGG的图像识别(附代码)
七月在线实验室
12+阅读 · 2018年3月30日
大数据分析研究组开源Easy Machine Learning系统
中国科学院网络数据重点实验室
16+阅读 · 2017年6月13日
相关基金
国家自然科学基金
8+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
8+阅读 · 2015年12月31日
国家自然科学基金
6+阅读 · 2015年12月31日
国家自然科学基金
27+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
15+阅读 · 2013年12月31日
国家自然科学基金
17+阅读 · 2008年12月31日
微信扫码咨询专知VIP会员