国家标准《人工智能预训练模型第2 部分：评测指标与方法》 - 专知VIP

会员服务 ·

49

国家标准 · 人工智能 · 预训练模型 ·

2024 年 6 月 15 日

国家标准《人工智能预训练模型第2 部分：评测指标与方法》

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

大模型是“大算力+强算法”相结合的产物，是人工智能的发展趋势和未来。目前，大规模的生态已初具规模，可以实现从“手工作坊”到“工厂模式”的AI 转型。大模型通常在大规模无标记数据上进行训练，以学习某种特征和规则。基于大模型开发应用时，可以通过大模型微调，完成多个应用场景的任务；大模型具有多模态信息处理能力，相比传统机器学习方式，能更高效地分析各行业数据，展现出更加强大的应用潜力；更重要的是，大模型具有自监督学习能力，不需要或很少需要人工标注数据进行训练，降低训练成本，从而可以加快 AI 产业化进程，降低 AI 应用门槛。当前，互联网厂商、AI 厂商、以及一些初创公司都接连推出了各自的大模型产品。

一方面，大型科技公司密集发布自研大模型，从算力层、平台层、模型层、应用层进行了四位一体的全面布局，涌现出华为云盘古大模型、百度文心一言、阿里云通义千问、科大讯飞星火认知等一批具有行业影响力的预训练大模型。

另一方面，国内各大高校与科研院所也在积极布局大模型，清华大学发布 ChatGLM，复旦大学推出国内首个类ChatGPT 大模型 MOSS。各大模型在服务业、工业、金融业已经开始落地应用。然而，当前大模型应用系统能力指标不明确、性能要求、测试方法不统一等标准化需求突出，为引导行业高质量发展，亟需统一的评测方法。在上述背景下，本标准聚焦大模型评测体系，从大模型构建过程和应用过程出发综合考虑能力要求，同时还将着重归纳、总结和梳理目前大模型应用比较好的服务业、金融、医疗、制造业、交通、教育等行业的应用过程特点、评估实践和未来趋势，以保障标准内容的适用性、可行性和覆盖性。制定《人工智能预训练模型第 2 部分：评测指标与方法》国家标准有助于不同类型的企业基于规范化、统一的能力和性能指标、测试数据、测试工具、测试环境和测试方法进行大模型评测与应用指导。

本文件规定了预训练模型评测内容、指标设置和评测方法。本文件适用于模型提供者、应用服务者和应用消费者等对预训练模型能力进行评估与测试，也可以为预训练模型的设计、开发、应用提供参考。

成为VIP会员查看完整内容

93

相关内容

国家标准

国家标准（national standard）是「由国家标准机构通过并公开发布的标准。」

国家标准《人工智能深度学习算法评估》（征求意见稿）

国家标准《人工智能深度学习算法评估》（征求意见稿）

专知会员服务

90+阅读 · 2024年6月17日

国家标准《人工智能预训练模型第3 部分服务能力成熟度评估》

国家标准《人工智能预训练模型第3 部分服务能力成熟度评估》

专知会员服务

63+阅读 · 2024年6月16日

《用于军用车辆探测的零样本多模态深度学习模型》

《用于军用车辆探测的零样本多模态深度学习模型》

专知会员服务

34+阅读 · 2024年5月9日

《大型语言模型持续学习》综述

《大型语言模型持续学习》综述

专知会员服务

93+阅读 · 2024年4月26日

《生成式人工智能模型：机遇与风险》

《生成式人工智能模型：机遇与风险》

专知会员服务

77+阅读 · 2024年4月22日

智能集群系统的强化学习方法综述

智能集群系统的强化学习方法综述

专知会员服务

83+阅读 · 2024年1月1日

多模态预训练模型综述

多模态预训练模型综述

专知会员服务

94+阅读 · 2023年11月20日

认知雷达《基于条件生成模型的模糊函数塑造》75页技术报告，含代码

认知雷达《基于条件生成模型的模糊函数塑造》75页技术报告，含代码

专知会员服务

29+阅读 · 2023年9月12日

大模型ChatGPT如何用于知识图谱构建？《利用大型语言模型增强知识图谱构建》论文

大模型ChatGPT如何用于知识图谱构建？《利用大型语言模型增强知识图谱构建》论文

专知会员服务

217+阅读 · 2023年5月9日

大模型如何赋能医学？全科医学人工智能基础模型

大模型如何赋能医学？全科医学人工智能基础模型

专知会员服务

88+阅读 · 2023年4月13日

基于模型的强化学习综述

基于模型的强化学习综述

专知

42+阅读 · 2022年7月13日

最新《知识驱动的文本生成》综述论文，44页pdf

最新《知识驱动的文本生成》综述论文，44页pdf

专知

25+阅读 · 2020年10月14日

【KDD2020-Tutorial】深度学习异常检测，180页ppt

【KDD2020-Tutorial】深度学习异常检测，180页ppt

专知

49+阅读 · 2020年8月28日

清华大学《高级机器学习》课程

清华大学《高级机器学习》课程

专知

40+阅读 · 2020年7月21日

【KDD2020】图神经网络生成式预训练

【KDD2020】图神经网络生成式预训练

专知

23+阅读 · 2020年7月3日

最新《可解释深度学习XDL》2020研究进展综述大全，54页pdf

最新《可解释深度学习XDL》2020研究进展综述大全，54页pdf

专知

37+阅读 · 2020年5月2日

零样本图像识别综述论文

零样本图像识别综述论文

专知

22+阅读 · 2020年4月4日

多模态深度学习综述，18页pdf

多模态深度学习综述，18页pdf

专知

50+阅读 · 2020年3月29日

实战 | 基于深度学习模型VGG的图像识别（附代码）

实战 | 基于深度学习模型VGG的图像识别（附代码）

七月在线实验室

13+阅读 · 2018年3月30日

大数据分析研究组开源Easy Machine Learning系统

大数据分析研究组开源Easy Machine Learning系统

中国科学院网络数据重点实验室

17+阅读 · 2017年6月13日

结合知识图谱的概率话题模型研究

国家自然科学基金

10+阅读 · 2015年12月31日

基于MEMS加速度传感器的智能终端手势识别及三维交互模型

国家自然科学基金

6+阅读 · 2015年12月31日

基于对称识别方法的贝叶斯probit模型稳健性研究

国家自然科学基金

3+阅读 · 2015年12月31日

大规模模糊RDF数据管理关键技术研究

国家自然科学基金

9+阅读 · 2015年12月31日

面向健康管理数据的关联型知识深度挖掘方法研究

国家自然科学基金

12+阅读 · 2015年12月31日

基于虚拟原型的信息物理融合系统高效可信构造研究

国家自然科学基金

7+阅读 · 2015年12月31日

面向大数据的安全迁移学习方法

国家自然科学基金

29+阅读 · 2015年12月31日

过程感知信息系统的跨组织业务过程建模与分析研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于融合先验知识的机器学习的多传感器融合研究

国家自然科学基金

16+阅读 · 2013年12月31日

基于动态分层与自学习的多智能体自适应协作模型

国家自然科学基金

17+阅读 · 2008年12月31日

Is ChatGPT a Good Recommender? A Preliminary Study

Arxiv

174+阅读 · 2023年4月20日

NeuralField-LDM: Scene Generation with Hierarchical Latent Diffusion Models

Arxiv

42+阅读 · 2023年4月19日

A Comprehensive Survey on Deep Graph Representation Learning

Arxiv

106+阅读 · 2023年4月11日

On Efficient Training of Large-Scale Deep Learning Models: A Literature Review

Arxiv

223+阅读 · 2023年4月7日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

494+阅读 · 2023年3月31日

ChatGPT is a Knowledgeable but Inexperienced Solver: An Investigation of Commonsense Problem in Large Language Models

Arxiv

63+阅读 · 2023年3月29日

Knowledge Graphs: Opportunities and Challenges

Arxiv

178+阅读 · 2023年3月24日

Sparks of Artificial General Intelligence: Early experiments with GPT-4

Arxiv

51+阅读 · 2023年3月22日

Data-centric Artificial Intelligence: A Survey

Arxiv

25+阅读 · 2023年3月17日

A survey and taxonomy of loss functions in machine learning

Arxiv

27+阅读 · 2023年1月13日

VIP会员

相关主题

预训练模型

相关VIP内容

国家标准《人工智能深度学习算法评估》（征求意见稿）

国家标准《人工智能深度学习算法评估》（征求意见稿）

专知会员服务

90+阅读 · 2024年6月17日

国家标准《人工智能预训练模型第3 部分服务能力成熟度评估》

国家标准《人工智能预训练模型第3 部分服务能力成熟度评估》

专知会员服务

63+阅读 · 2024年6月16日

《用于军用车辆探测的零样本多模态深度学习模型》

《用于军用车辆探测的零样本多模态深度学习模型》

专知会员服务

34+阅读 · 2024年5月9日

《大型语言模型持续学习》综述

《大型语言模型持续学习》综述

专知会员服务

93+阅读 · 2024年4月26日

《生成式人工智能模型：机遇与风险》

《生成式人工智能模型：机遇与风险》

专知会员服务

77+阅读 · 2024年4月22日

智能集群系统的强化学习方法综述

智能集群系统的强化学习方法综述

专知会员服务

83+阅读 · 2024年1月1日

多模态预训练模型综述

多模态预训练模型综述

专知会员服务

94+阅读 · 2023年11月20日

认知雷达《基于条件生成模型的模糊函数塑造》75页技术报告，含代码

认知雷达《基于条件生成模型的模糊函数塑造》75页技术报告，含代码

专知会员服务

29+阅读 · 2023年9月12日

大模型ChatGPT如何用于知识图谱构建？《利用大型语言模型增强知识图谱构建》论文

大模型ChatGPT如何用于知识图谱构建？《利用大型语言模型增强知识图谱构建》论文

专知会员服务

217+阅读 · 2023年5月9日

大模型如何赋能医学？全科医学人工智能基础模型

大模型如何赋能医学？全科医学人工智能基础模型

专知会员服务

88+阅读 · 2023年4月13日

热门VIP内容

开通专知VIP会员享更多权益服务

隐身自主无人水下航行器技术如何变革水下作战并重塑海军竞争

《俄乌战争中的无人系统：新的战争方式与新兴趋势——来自前线的印象》报告

《海上自主水面船舶远程操作中心：安全可持续运行的多维度分析》

相关资讯

基于模型的强化学习综述

基于模型的强化学习综述

专知

42+阅读 · 2022年7月13日

最新《知识驱动的文本生成》综述论文，44页pdf

最新《知识驱动的文本生成》综述论文，44页pdf

专知

25+阅读 · 2020年10月14日

【KDD2020-Tutorial】深度学习异常检测，180页ppt

【KDD2020-Tutorial】深度学习异常检测，180页ppt

专知

49+阅读 · 2020年8月28日

清华大学《高级机器学习》课程

清华大学《高级机器学习》课程

专知

40+阅读 · 2020年7月21日

【KDD2020】图神经网络生成式预训练

【KDD2020】图神经网络生成式预训练

专知

23+阅读 · 2020年7月3日

最新《可解释深度学习XDL》2020研究进展综述大全，54页pdf

最新《可解释深度学习XDL》2020研究进展综述大全，54页pdf

专知

37+阅读 · 2020年5月2日

零样本图像识别综述论文

零样本图像识别综述论文

专知

22+阅读 · 2020年4月4日

多模态深度学习综述，18页pdf

多模态深度学习综述，18页pdf

专知

50+阅读 · 2020年3月29日

实战 | 基于深度学习模型VGG的图像识别（附代码）

实战 | 基于深度学习模型VGG的图像识别（附代码）

七月在线实验室

13+阅读 · 2018年3月30日

大数据分析研究组开源Easy Machine Learning系统

大数据分析研究组开源Easy Machine Learning系统

中国科学院网络数据重点实验室

17+阅读 · 2017年6月13日

相关基金

结合知识图谱的概率话题模型研究

国家自然科学基金

10+阅读 · 2015年12月31日

基于MEMS加速度传感器的智能终端手势识别及三维交互模型

国家自然科学基金

6+阅读 · 2015年12月31日

基于对称识别方法的贝叶斯probit模型稳健性研究

国家自然科学基金

3+阅读 · 2015年12月31日

大规模模糊RDF数据管理关键技术研究

国家自然科学基金

9+阅读 · 2015年12月31日

面向健康管理数据的关联型知识深度挖掘方法研究

国家自然科学基金

12+阅读 · 2015年12月31日

基于虚拟原型的信息物理融合系统高效可信构造研究

国家自然科学基金

7+阅读 · 2015年12月31日

面向大数据的安全迁移学习方法

国家自然科学基金

29+阅读 · 2015年12月31日

过程感知信息系统的跨组织业务过程建模与分析研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于融合先验知识的机器学习的多传感器融合研究

国家自然科学基金

16+阅读 · 2013年12月31日

基于动态分层与自学习的多智能体自适应协作模型

国家自然科学基金

17+阅读 · 2008年12月31日

相关论文

Is ChatGPT a Good Recommender? A Preliminary Study

Arxiv

174+阅读 · 2023年4月20日

NeuralField-LDM: Scene Generation with Hierarchical Latent Diffusion Models

Arxiv

42+阅读 · 2023年4月19日

A Comprehensive Survey on Deep Graph Representation Learning

Arxiv

106+阅读 · 2023年4月11日

On Efficient Training of Large-Scale Deep Learning Models: A Literature Review

Arxiv

223+阅读 · 2023年4月7日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

494+阅读 · 2023年3月31日

ChatGPT is a Knowledgeable but Inexperienced Solver: An Investigation of Commonsense Problem in Large Language Models

Arxiv

63+阅读 · 2023年3月29日

Knowledge Graphs: Opportunities and Challenges

Arxiv

178+阅读 · 2023年3月24日

Sparks of Artificial General Intelligence: Early experiments with GPT-4

Arxiv

51+阅读 · 2023年3月22日

Data-centric Artificial Intelligence: A Survey

Arxiv

25+阅读 · 2023年3月17日

A survey and taxonomy of loss functions in machine learning

Arxiv

27+阅读 · 2023年1月13日

微信扫码咨询专知VIP会员