电力系统的大语言模型微调数据准备规范 - 专知VIP

会员服务 ·

48

电力系统 · 大语言模型 ·

2024 年 1 月 11 日

电力系统的大语言模型微调数据准备规范

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

针对目前电力系统中大语言模型技术应用相关的业务场景，主要解决如何有效地采集和清洗与电力系统相关的数据，包括数据来源的选择和数据质量的评估；定义必要的数据标签和注释，以确保模型了解电力系统领域的相关概念和关系；规定数据的格式和结构，以适应大语言模型的微调需求，包括数据的输入和输出格式；确定数据的安全存储方式，并定义数据共享政策，以确保数据的合规和安全性。本文件适用于电力系统的大语言模型的数据准备，包括数据的采集、清理、标注、注释和整理等所有环节。此标准的目的在于规范在大语言模型训练中的数据处理过程，以保证数据的可用性、一致性和可追溯性。本文件规定了人工智能大语言模型在电力系统中的微调数据准备规范，本文件共分为数据准备要求、数据准备规范、数据准备流程等。本文件适用于各单位使用大语言模型技术解决相关业务需求，适用于电力系统人工智能大语言模型的应用开发等业务场景，帮助业务人员以及开发人员完成模型训练、模型微调等相关工作。

本文件规定了人工智能大语言模型在电力系统中的微调数据准备规范，本文件共分为数据准备要求、数据准备规范、数据处理流程等。其中数据准备主要用于规范电力系统的大模型在微调训练中的数据收集、数据格式以及数据隐私与安全等，数据准备规范主要用于规范电力系统大模型微调训练中的数据预处理、数据转换、数据标签与注释、数据及划分、数据格式化、数据集质量评估、数据增强以及数据更新与维护等，数据处理流程主要用于规范数据预处理的一般步骤和中文数据预处理的步骤等。具体内容组织框架见图1:

成为VIP会员查看完整内容

69

相关内容

电力系统

电力系统是指由发电、输电、变电、配电和用电等环节组成的电能生产与消费系统。

大型语言模型中提示工程的系统综述：技术与应用

大型语言模型中提示工程的系统综述：技术与应用

专知会员服务

79+阅读 · 2024年2月15日

【AAAI2024】使用大型语言模型的生成式多模态知识检索

【AAAI2024】使用大型语言模型的生成式多模态知识检索

专知会员服务

57+阅读 · 2024年1月19日

时间序列复杂网络分析中的可视图方法研究综述

时间序列复杂网络分析中的可视图方法研究综述

专知会员服务

50+阅读 · 2023年12月2日

大型语言模型在软件工程：调查与待解决的问题

大型语言模型在软件工程：调查与待解决的问题

专知会员服务

76+阅读 · 2023年10月6日

基于语言模型增强的中文关系抽取方法

基于语言模型增强的中文关系抽取方法

专知会员服务

56+阅读 · 2023年9月18日

大模型ChatGPT如何用于知识图谱构建？《利用大型语言模型增强知识图谱构建》论文

大模型ChatGPT如何用于知识图谱构建？《利用大型语言模型增强知识图谱构建》论文

专知会员服务

216+阅读 · 2023年5月9日

基于深度强化学习的对手建模方法研究综述

基于深度强化学习的对手建模方法研究综述

专知会员服务

83+阅读 · 2023年4月17日

面向多智能体博弈对抗的对手建模框架

面向多智能体博弈对抗的对手建模框架

专知会员服务

160+阅读 · 2022年9月28日

自然语言处理预训练模型的研究综述

专知会员服务

123+阅读 · 2020年12月9日

【KDD2020教程】多模态网络表示学习

【KDD2020教程】多模态网络表示学习

专知会员服务

132+阅读 · 2020年8月26日

《基于模型的系统工程方法应用于任务工程建模用例》169页报告

《基于模型的系统工程方法应用于任务工程建模用例》169页报告

专知

54+阅读 · 2023年4月6日

基于模型的强化学习综述

基于模型的强化学习综述

专知

42+阅读 · 2022年7月13日

多模态视觉语言表征学习研究综述

多模态视觉语言表征学习研究综述

专知

27+阅读 · 2020年12月3日

实体关系抽取方法研究综述

实体关系抽取方法研究综述

专知

12+阅读 · 2020年7月19日

论文浅尝 | 混合注意力原型网络的含噪音少样本的关系分类

论文浅尝 | 混合注意力原型网络的含噪音少样本的关系分类

开放知识图谱

12+阅读 · 2019年5月26日

NLP实践：对话系统技术原理和应用

NLP实践：对话系统技术原理和应用

AI100

34+阅读 · 2019年3月20日

【大数据】海量数据分析能力形成和大数据关键技术

【大数据】海量数据分析能力形成和大数据关键技术

产业智能官

17+阅读 · 2018年10月29日

无人机集群、蜂群与蜂群算法

无人机集群、蜂群与蜂群算法

无人机

92+阅读 · 2018年9月25日

知识在检索式对话系统的应用

知识在检索式对话系统的应用

微信AI

32+阅读 · 2018年9月20日

语义分割中的深度学习方法全解：从FCN、SegNet到DeepLab

语义分割中的深度学习方法全解：从FCN、SegNet到DeepLab

炼数成金订阅号

26+阅读 · 2017年7月10日

非结构化管理决策大数据平台构建与关键技术

国家自然科学基金

11+阅读 · 2015年12月31日

能源经济环境集成系统中的多重内生技术演化建模与政策优化设计

国家自然科学基金

2+阅读 · 2015年12月31日

基于犹豫模糊语言信息的定性决策理论与方法

国家自然科学基金

2+阅读 · 2015年12月31日

基于语义推理的船舶舱室布置进化设计方法

国家自然科学基金

0+阅读 · 2015年12月31日

不完备/冗余数据下复杂产品关联建模设计方法及其应用

国家自然科学基金

1+阅读 · 2015年12月31日

工业过程动态数据的多模型在线重构研究

国家自然科学基金

1+阅读 · 2015年12月31日

考虑缓冲区大小及在制品数量的多工序生产系统预测维护方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于神经网络和强化学习的车辆装配系统中的多载量小车实时调度方法

国家自然科学基金

4+阅读 · 2014年12月31日

过程感知信息系统的跨组织业务过程建模与分析研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于动态作业负荷的混联制造系统预知维护和机会维修方法

国家自然科学基金

2+阅读 · 2014年12月31日

Training dynamic models using early exits for automatic speech recognition on resource-constrained devices

Arxiv

0+阅读 · 2024年2月22日

Generalized linear models with spatial dependence and a functional covariate

Arxiv

0+阅读 · 2024年2月21日

Is ChatGPT a Good Recommender? A Preliminary Study

Arxiv

171+阅读 · 2023年4月20日

NeuralField-LDM: Scene Generation with Hierarchical Latent Diffusion Models

Arxiv

42+阅读 · 2023年4月19日

A Comprehensive Survey on Deep Graph Representation Learning

Arxiv

103+阅读 · 2023年4月11日

On Efficient Training of Large-Scale Deep Learning Models: A Literature Review

Arxiv

216+阅读 · 2023年4月7日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

476+阅读 · 2023年3月31日

Unleashing the Power of Edge-Cloud Generative AI in Mobile Networks: A Survey of AIGC Services

Arxiv

147+阅读 · 2023年3月29日

Nature Language Reasoning, A Survey

Arxiv

78+阅读 · 2023年3月26日

Data-centric Artificial Intelligence: A Survey

Arxiv

24+阅读 · 2023年3月17日

VIP会员

相关主题

大语言模型

相关VIP内容

大型语言模型中提示工程的系统综述：技术与应用

大型语言模型中提示工程的系统综述：技术与应用

专知会员服务

79+阅读 · 2024年2月15日

【AAAI2024】使用大型语言模型的生成式多模态知识检索

【AAAI2024】使用大型语言模型的生成式多模态知识检索

专知会员服务

57+阅读 · 2024年1月19日

时间序列复杂网络分析中的可视图方法研究综述

时间序列复杂网络分析中的可视图方法研究综述

专知会员服务

50+阅读 · 2023年12月2日

大型语言模型在软件工程：调查与待解决的问题

大型语言模型在软件工程：调查与待解决的问题

专知会员服务

76+阅读 · 2023年10月6日

基于语言模型增强的中文关系抽取方法

基于语言模型增强的中文关系抽取方法

专知会员服务

56+阅读 · 2023年9月18日

大模型ChatGPT如何用于知识图谱构建？《利用大型语言模型增强知识图谱构建》论文

大模型ChatGPT如何用于知识图谱构建？《利用大型语言模型增强知识图谱构建》论文

专知会员服务

216+阅读 · 2023年5月9日

基于深度强化学习的对手建模方法研究综述

基于深度强化学习的对手建模方法研究综述

专知会员服务

83+阅读 · 2023年4月17日

面向多智能体博弈对抗的对手建模框架

面向多智能体博弈对抗的对手建模框架

专知会员服务

160+阅读 · 2022年9月28日

自然语言处理预训练模型的研究综述

专知会员服务

123+阅读 · 2020年12月9日

【KDD2020教程】多模态网络表示学习

【KDD2020教程】多模态网络表示学习

专知会员服务

132+阅读 · 2020年8月26日

热门VIP内容

开通专知VIP会员享更多权益服务

《小型无人机系统侦测追踪技术：声学、计算机视觉与深度学习融合方案》最新98页

《"牧羊人网格"拦截策略：实现无人机集群可靠拦截的新范式》

光纤无人机：反无人机系统的重大挑战

《作战建模与仿真实证研究》

相关资讯

《基于模型的系统工程方法应用于任务工程建模用例》169页报告

《基于模型的系统工程方法应用于任务工程建模用例》169页报告

专知

54+阅读 · 2023年4月6日

基于模型的强化学习综述

基于模型的强化学习综述

专知

42+阅读 · 2022年7月13日

多模态视觉语言表征学习研究综述

多模态视觉语言表征学习研究综述

专知

27+阅读 · 2020年12月3日

实体关系抽取方法研究综述

实体关系抽取方法研究综述

专知

12+阅读 · 2020年7月19日

论文浅尝 | 混合注意力原型网络的含噪音少样本的关系分类

论文浅尝 | 混合注意力原型网络的含噪音少样本的关系分类

开放知识图谱

12+阅读 · 2019年5月26日

NLP实践：对话系统技术原理和应用

NLP实践：对话系统技术原理和应用

AI100

34+阅读 · 2019年3月20日

【大数据】海量数据分析能力形成和大数据关键技术

【大数据】海量数据分析能力形成和大数据关键技术

产业智能官

17+阅读 · 2018年10月29日

无人机集群、蜂群与蜂群算法

无人机集群、蜂群与蜂群算法

无人机

92+阅读 · 2018年9月25日

知识在检索式对话系统的应用

知识在检索式对话系统的应用

微信AI

32+阅读 · 2018年9月20日

语义分割中的深度学习方法全解：从FCN、SegNet到DeepLab

语义分割中的深度学习方法全解：从FCN、SegNet到DeepLab

炼数成金订阅号

26+阅读 · 2017年7月10日

相关基金

非结构化管理决策大数据平台构建与关键技术

国家自然科学基金

11+阅读 · 2015年12月31日

能源经济环境集成系统中的多重内生技术演化建模与政策优化设计

国家自然科学基金

2+阅读 · 2015年12月31日

基于犹豫模糊语言信息的定性决策理论与方法

国家自然科学基金

2+阅读 · 2015年12月31日

基于语义推理的船舶舱室布置进化设计方法

国家自然科学基金

0+阅读 · 2015年12月31日

不完备/冗余数据下复杂产品关联建模设计方法及其应用

国家自然科学基金

1+阅读 · 2015年12月31日

工业过程动态数据的多模型在线重构研究

国家自然科学基金

1+阅读 · 2015年12月31日

考虑缓冲区大小及在制品数量的多工序生产系统预测维护方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于神经网络和强化学习的车辆装配系统中的多载量小车实时调度方法

国家自然科学基金

4+阅读 · 2014年12月31日

过程感知信息系统的跨组织业务过程建模与分析研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于动态作业负荷的混联制造系统预知维护和机会维修方法

国家自然科学基金

2+阅读 · 2014年12月31日

相关论文

Training dynamic models using early exits for automatic speech recognition on resource-constrained devices

Arxiv

0+阅读 · 2024年2月22日

Generalized linear models with spatial dependence and a functional covariate

Arxiv

0+阅读 · 2024年2月21日

Is ChatGPT a Good Recommender? A Preliminary Study

Arxiv

171+阅读 · 2023年4月20日

NeuralField-LDM: Scene Generation with Hierarchical Latent Diffusion Models

Arxiv

42+阅读 · 2023年4月19日

A Comprehensive Survey on Deep Graph Representation Learning

Arxiv

103+阅读 · 2023年4月11日

On Efficient Training of Large-Scale Deep Learning Models: A Literature Review

Arxiv

216+阅读 · 2023年4月7日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

476+阅读 · 2023年3月31日

Unleashing the Power of Edge-Cloud Generative AI in Mobile Networks: A Survey of AIGC Services

Arxiv

147+阅读 · 2023年3月29日

Nature Language Reasoning, A Survey

Arxiv

78+阅读 · 2023年3月26日

Data-centric Artificial Intelligence: A Survey

Arxiv

24+阅读 · 2023年3月17日

微信扫码咨询专知VIP会员