针对目前电力系统中大语言模型技术应用相关的业务场景,主要解决如何有 效地采集和清洗与电力系统相关的数据,包括数据来源的选择和数据质量的评估; 定义必要的数据标签和注释,以确保模型了解电力系统领域的相关概念和关系; 规定数据的格式和结构,以适应大语言模型的微调需求,包括数据的输入和输出 格式;确定数据的安全存储方式,并定义数据共享政策,以确保数据的合规和安 全性。本文件适用于电力系统的大语言模型的数据准备,包括数据的采集、清理、标注、注释 和整理等所有环节。此标准的目的在于规范在大语言模型训练中的数据处理过程,以保证数 据的可用性、一致性和可追溯性。本文件规定了人工智能大语言模型在电力系统中的微调数 据准备规范,本文件共分为数据准备要求、数据准备规范、数据准备流程等。 本文件适用于各单位使用大语言模型技术解决相关业务需求,适用于电力系统人工智能 大语言模型的应用开发等业务场景,帮助业务人员以及开发人员完成模型训练、模型微调等 相关工作。

本文件规定了人工智能大语言模型在电力系统中的微调数据准备规范,本文件共分为数 据准备要求、数据准备规范、数据处理流程等。其中数据准备主要用于规范电力系统的大模 型在微调训练中的数据收集、数据格式以及数据隐私与安全等,数据准备规范主要用于规范 电力系统大模型微调训练中的数据预处理、数据转换、数据标签与注释、数据及划分、数据 格式化、数据集质量评估、数据增强以及数据更新与维护等,数据处理流程主要用于规范数 据预处理的一般步骤和中文数据预处理的步骤等。具体内容组织框架见图1:

成为VIP会员查看完整内容
65

相关内容

电力系统是指由发电、输电、变电、配电和用电等环节组成的电能生产与消费系统。
时间序列复杂网络分析中的可视图方法研究综述
专知会员服务
47+阅读 · 2023年12月2日
大型语言模型在软件工程:调查与待解决的问题
专知会员服务
73+阅读 · 2023年10月6日
基于语言模型增强的中文关系抽取方法
专知会员服务
55+阅读 · 2023年9月18日
基于深度强化学习的对手建模方法研究综述
专知会员服务
80+阅读 · 2023年4月17日
面向多智能体博弈对抗的对手建模框架
专知会员服务
153+阅读 · 2022年9月28日
专知会员服务
119+阅读 · 2020年12月9日
【KDD2020教程】多模态网络表示学习
专知会员服务
129+阅读 · 2020年8月26日
基于模型的强化学习综述
专知
28+阅读 · 2022年7月13日
多模态视觉语言表征学习研究综述
专知
27+阅读 · 2020年12月3日
实体关系抽取方法研究综述
专知
11+阅读 · 2020年7月19日
NLP实践:对话系统技术原理和应用
AI100
34+阅读 · 2019年3月20日
【大数据】海量数据分析能力形成和大数据关键技术
产业智能官
17+阅读 · 2018年10月29日
无人机集群、蜂群与蜂群算法
无人机
89+阅读 · 2018年9月25日
知识在检索式对话系统的应用
微信AI
32+阅读 · 2018年9月20日
语义分割中的深度学习方法全解:从FCN、SegNet到DeepLab
炼数成金订阅号
26+阅读 · 2017年7月10日
国家自然科学基金
9+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
Arxiv
157+阅读 · 2023年4月20日
A Survey of Large Language Models
Arxiv
398+阅读 · 2023年3月31日
Arxiv
66+阅读 · 2023年3月26日
Arxiv
20+阅读 · 2023年3月17日
VIP会员
相关VIP内容
时间序列复杂网络分析中的可视图方法研究综述
专知会员服务
47+阅读 · 2023年12月2日
大型语言模型在软件工程:调查与待解决的问题
专知会员服务
73+阅读 · 2023年10月6日
基于语言模型增强的中文关系抽取方法
专知会员服务
55+阅读 · 2023年9月18日
基于深度强化学习的对手建模方法研究综述
专知会员服务
80+阅读 · 2023年4月17日
面向多智能体博弈对抗的对手建模框架
专知会员服务
153+阅读 · 2022年9月28日
专知会员服务
119+阅读 · 2020年12月9日
【KDD2020教程】多模态网络表示学习
专知会员服务
129+阅读 · 2020年8月26日
相关资讯
基于模型的强化学习综述
专知
28+阅读 · 2022年7月13日
多模态视觉语言表征学习研究综述
专知
27+阅读 · 2020年12月3日
实体关系抽取方法研究综述
专知
11+阅读 · 2020年7月19日
NLP实践:对话系统技术原理和应用
AI100
34+阅读 · 2019年3月20日
【大数据】海量数据分析能力形成和大数据关键技术
产业智能官
17+阅读 · 2018年10月29日
无人机集群、蜂群与蜂群算法
无人机
89+阅读 · 2018年9月25日
知识在检索式对话系统的应用
微信AI
32+阅读 · 2018年9月20日
语义分割中的深度学习方法全解:从FCN、SegNet到DeepLab
炼数成金订阅号
26+阅读 · 2017年7月10日
相关基金
国家自然科学基金
9+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
微信扫码咨询专知VIP会员