基于自聊数据的低参数调优开源聊天模型 Baize (Baize: An Open-Source Chat Model with Parameter-Efficient Tuning on Self-Chat Data) - 专知论文

会员服务 ·

0

多轮对话 · Projection · ChatGPT · LORA · LaMa ·

2023 年 4 月 4 日

Baize: An Open-Source Chat Model with Parameter-Efficient Tuning on Self-Chat Data

翻译：基于自聊数据的低参数调优开源聊天模型 Baize

Canwen Xu,Daya Guo,Nan Duan,Julian McAuley

Chat models, such as ChatGPT, have shown impressive capabilities and have been rapidly adopted across numerous domains. However, these models are only accessible through a restricted API, creating barriers for new research and progress in the field. We propose a pipeline that can automatically generate a high-quality multi-turn chat corpus by leveraging ChatGPT to engage in a conversation with itself. Subsequently, we employ parameter-efficient tuning to enhance LLaMA, an open-source large language model. The resulting model, named Baize, demonstrates good performance in multi-turn dialogues with guardrails that minimize potential risks. The Baize models and data are released for research purposes only at https://github.com/project-baize/baize. An online demo is also available at https://huggingface.co/spaces/project-baize/baize-lora-7B.

翻译：聊天模型（例如ChatGPT）已经显示出了令人印象深刻的能力，并已在众多领域迅速得到采纳。但是，这些模型仅通过受限API进行访问，从而为新研究和领域进展制造了障碍。我们提出了一个流程，可以通过利用ChatGPT与自己对话来自动生成高质量的多轮对话语料库。随后，我们采用低参数调优来增强开源大型语言模型LLaMA。结果模型被命名为Baize，与最小化潜在风险的防卫栏一起，在多轮对话中表现出良好的性能。Baize模型和数据仅用于研究目的，请在https://github.com/project-baize/baize上获取。在线演示也可在https://huggingface.co/spaces/project-baize/baize-lora-7B上获得。

1

相关内容

多轮对话

用ChatGPT训练羊驼：「白泽」开源，轻松构建专属模型，可在线试玩

用ChatGPT训练羊驼：「白泽」开源，轻松构建专属模型，可在线试玩

专知会员服务

69+阅读 · 2023年4月5日

130亿参数，8个A100训练，UC伯克利发布对话模型Koala

130亿参数，8个A100训练，UC伯克利发布对话模型Koala

专知会员服务

44+阅读 · 2023年4月5日

百篇论文纵览大型语言模型最新研究进展

百篇论文纵览大型语言模型最新研究进展

专知会员服务

70+阅读 · 2023年3月31日

【Hugging Face】使用自定义数据集微调语义分割模型，Fine-Tune a Semantic Segmentation Model with a Custom Dataset

【Hugging Face】使用自定义数据集微调语义分割模型，Fine-Tune a Semantic Segmentation Model with a Custom Dataset

专知会员服务

21+阅读 · 2022年3月18日

ICLR 2021杰出论文奖出炉，8篇论文上榜！

专知会员服务

26+阅读 · 2021年4月2日

近期必读的6篇 NeurIPS 2019 的零样本学习(Zero-Shot Learning)论文

近期必读的6篇 NeurIPS 2019 的零样本学习(Zero-Shot Learning)论文

专知会员服务

60+阅读 · 2019年12月24日

【AAAI2020论文-清华大学】基于人物稀疏数据的预训练个性化对话生成模型（A Pre-training Based Personalized Dialogue Generation Model with Persona-sparse Data）

【AAAI2020论文-清华大学】基于人物稀疏数据的预训练个性化对话生成模型（A Pre-training Based Personalized Dialogue Generation Model with Persona-sparse Data）

专知会员服务

29+阅读 · 2019年11月15日

微软发布DialoGPT预训练语言模型，论文与代码 Large-Scale Generative Pre-training for Conversational Response Generation

微软发布DialoGPT预训练语言模型，论文与代码 Large-Scale Generative Pre-training for Conversational Response Generation

专知会员服务

28+阅读 · 2019年11月8日

强化学习最新教程，17页pdf

强化学习最新教程，17页pdf

专知会员服务

182+阅读 · 2019年10月11日

机器学习相关资源(框架、库、软件)大列表

机器学习相关资源(框架、库、软件)大列表

专知会员服务

40+阅读 · 2019年10月9日

终结扩散模型：OpenAI开源新模型代码，一步成图，1秒18张

终结扩散模型：OpenAI开源新模型代码，一步成图，1秒18张

机器之心

4+阅读 · 2023年4月13日

用ChatGPT训练羊驼：「白泽」开源，轻松构建专属模型，可在线试玩

用ChatGPT训练羊驼：「白泽」开源，轻松构建专属模型，可在线试玩

机器之心

0+阅读 · 2023年4月4日

VCIP 2022 Call for Demos

VCIP 2022 Call for Demos

CCF多媒体专委会

1+阅读 · 2022年6月6日

多任务学习(Multitask-Learning)相关资料、经典论文、开源代码整理分享

多任务学习(Multitask-Learning)相关资料、经典论文、开源代码整理分享

深度学习与NLP

45+阅读 · 2019年10月22日

DeepMind开源最牛无监督学习BigBiGAN预训练模型

DeepMind开源最牛无监督学习BigBiGAN预训练模型

新智元

10+阅读 · 2019年10月10日

RoBERTa for Chinese：大规模中文预训练RoBERTa模型

RoBERTa for Chinese：大规模中文预训练RoBERTa模型

AINLP

30+阅读 · 2019年9月8日

Transferring Knowledge across Learning Processes

Transferring Knowledge across Learning Processes

CreateAMind

29+阅读 · 2019年5月18日

A Technical Overview of AI & ML in 2018 & Trends for 2019

A Technical Overview of AI & ML in 2018 & Trends for 2019

待字闺中

18+阅读 · 2018年12月24日

谷歌发表的史上最强NLP模型BERT的官方代码和预训练模型可以下载了

谷歌发表的史上最强NLP模型BERT的官方代码和预训练模型可以下载了

AINLP

12+阅读 · 2018年11月1日

【论文推荐】最新5篇聊天机器人（Chatbot）相关论文—深度强化学习、社交聊天机器人小冰、对话聊天助手、序列-序列、动态词汇

【论文推荐】最新5篇聊天机器人（Chatbot）相关论文—深度强化学习、社交聊天机器人小冰、对话聊天助手、序列-序列、动态词汇

专知

23+阅读 · 2018年1月30日

受体MDSCs通过CEACAM1-TIM3调控NK细胞功能介导肝移植免疫耐受的机制研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于元胞自动机和数据同化的溢油模拟

国家自然科学基金

0+阅读 · 2013年12月31日

c-Myc-GPC5通路调控前列腺癌进展的分子机理

国家自然科学基金

0+阅读 · 2013年12月31日

数据驱动的三维城市建筑矢量化建模研究

国家自然科学基金

0+阅读 · 2013年12月31日

数据分析中的大规模矩阵优化模型求解算法研究

国家自然科学基金

2+阅读 · 2013年12月31日

低温胁迫下甘蓝型油菜种子萌发出苗的生化反应及调控机制研究

国家自然科学基金

0+阅读 · 2013年12月31日

水稻CIC1蛋白调节光合作用低温适应的分子机理研究

国家自然科学基金

0+阅读 · 2012年12月31日

高能物理数据分析的Hadoop/HBASE平台研究

国家自然科学基金

1+阅读 · 2012年12月31日

耦合多源数据的森林碳水通量模型驱动参数同化机制

国家自然科学基金

0+阅读 · 2012年12月31日

基于C-PolInSAR和PolInSAR的森林垂直结构参数反演

国家自然科学基金

0+阅读 · 2009年12月31日

Automatic Model Selection with Large Language Models for Reasoning

Arxiv

0+阅读 · 2023年5月23日

Dynosaur: A Dynamic Growth Paradigm for Instruction-Tuning Data Curation

Arxiv

0+阅读 · 2023年5月23日

Domain Private Transformers

Arxiv

0+阅读 · 2023年5月23日

Improving Robustness in Knowledge Distillation Using Domain-Targeted Data Augmentation

Arxiv

0+阅读 · 2023年5月22日

Pengi: An Audio Language Model for Audio Tasks

Arxiv

0+阅读 · 2023年5月19日

Empower Large Language Model to Perform Better on Industrial Domain-Specific Question Answering

Arxiv

0+阅读 · 2023年5月19日

Zero-Shot Text Classification via Self-Supervised Tuning

Arxiv

0+阅读 · 2023年5月19日

Leveraging ChatGPT for Power System Programming Tasks

Arxiv

1+阅读 · 2023年5月18日

Augmented Large Language Models with Parametric Knowledge Guiding

Arxiv

20+阅读 · 2023年5月8日

Self-correcting Q-Learning

Arxiv

11+阅读 · 2020年12月2日

VIP会员

文章信息

相关主题

相关VIP内容

用ChatGPT训练羊驼：「白泽」开源，轻松构建专属模型，可在线试玩

用ChatGPT训练羊驼：「白泽」开源，轻松构建专属模型，可在线试玩

专知会员服务

69+阅读 · 2023年4月5日

130亿参数，8个A100训练，UC伯克利发布对话模型Koala

130亿参数，8个A100训练，UC伯克利发布对话模型Koala

专知会员服务

44+阅读 · 2023年4月5日

百篇论文纵览大型语言模型最新研究进展

百篇论文纵览大型语言模型最新研究进展

专知会员服务

70+阅读 · 2023年3月31日

【Hugging Face】使用自定义数据集微调语义分割模型，Fine-Tune a Semantic Segmentation Model with a Custom Dataset

【Hugging Face】使用自定义数据集微调语义分割模型，Fine-Tune a Semantic Segmentation Model with a Custom Dataset

专知会员服务

21+阅读 · 2022年3月18日

ICLR 2021杰出论文奖出炉，8篇论文上榜！

专知会员服务

26+阅读 · 2021年4月2日

近期必读的6篇 NeurIPS 2019 的零样本学习(Zero-Shot Learning)论文

近期必读的6篇 NeurIPS 2019 的零样本学习(Zero-Shot Learning)论文

专知会员服务

60+阅读 · 2019年12月24日

【AAAI2020论文-清华大学】基于人物稀疏数据的预训练个性化对话生成模型（A Pre-training Based Personalized Dialogue Generation Model with Persona-sparse Data）

【AAAI2020论文-清华大学】基于人物稀疏数据的预训练个性化对话生成模型（A Pre-training Based Personalized Dialogue Generation Model with Persona-sparse Data）

专知会员服务

29+阅读 · 2019年11月15日

微软发布DialoGPT预训练语言模型，论文与代码 Large-Scale Generative Pre-training for Conversational Response Generation

微软发布DialoGPT预训练语言模型，论文与代码 Large-Scale Generative Pre-training for Conversational Response Generation

专知会员服务

28+阅读 · 2019年11月8日

强化学习最新教程，17页pdf

强化学习最新教程，17页pdf

专知会员服务

182+阅读 · 2019年10月11日

机器学习相关资源(框架、库、软件)大列表

机器学习相关资源(框架、库、软件)大列表

专知会员服务

40+阅读 · 2019年10月9日

热门VIP内容

开通专知VIP会员享更多权益服务

人工智能赋能自主武器与人类控制第三部分：人类控制与系统操作员 | 35页

人工智能赋能自主武器与人类控制第一部分：人类控制与机器学习的设计和开发 | 46页

军事指挥控制系统：2025年5种用途

人工智能赋能自主武器与人类控制第二部分：人类控制与军事指挥官 | 38页

相关资讯

终结扩散模型：OpenAI开源新模型代码，一步成图，1秒18张

终结扩散模型：OpenAI开源新模型代码，一步成图，1秒18张

机器之心

4+阅读 · 2023年4月13日

用ChatGPT训练羊驼：「白泽」开源，轻松构建专属模型，可在线试玩

用ChatGPT训练羊驼：「白泽」开源，轻松构建专属模型，可在线试玩

机器之心

0+阅读 · 2023年4月4日

VCIP 2022 Call for Demos

VCIP 2022 Call for Demos

CCF多媒体专委会

1+阅读 · 2022年6月6日

多任务学习(Multitask-Learning)相关资料、经典论文、开源代码整理分享

多任务学习(Multitask-Learning)相关资料、经典论文、开源代码整理分享

深度学习与NLP

45+阅读 · 2019年10月22日

DeepMind开源最牛无监督学习BigBiGAN预训练模型

DeepMind开源最牛无监督学习BigBiGAN预训练模型

新智元

10+阅读 · 2019年10月10日

RoBERTa for Chinese：大规模中文预训练RoBERTa模型

RoBERTa for Chinese：大规模中文预训练RoBERTa模型

AINLP

30+阅读 · 2019年9月8日

Transferring Knowledge across Learning Processes

Transferring Knowledge across Learning Processes

CreateAMind

29+阅读 · 2019年5月18日

A Technical Overview of AI & ML in 2018 & Trends for 2019

A Technical Overview of AI & ML in 2018 & Trends for 2019

待字闺中

18+阅读 · 2018年12月24日

谷歌发表的史上最强NLP模型BERT的官方代码和预训练模型可以下载了

谷歌发表的史上最强NLP模型BERT的官方代码和预训练模型可以下载了

AINLP

12+阅读 · 2018年11月1日

【论文推荐】最新5篇聊天机器人（Chatbot）相关论文—深度强化学习、社交聊天机器人小冰、对话聊天助手、序列-序列、动态词汇

【论文推荐】最新5篇聊天机器人（Chatbot）相关论文—深度强化学习、社交聊天机器人小冰、对话聊天助手、序列-序列、动态词汇

专知

23+阅读 · 2018年1月30日

相关论文

Automatic Model Selection with Large Language Models for Reasoning

Arxiv

0+阅读 · 2023年5月23日

Dynosaur: A Dynamic Growth Paradigm for Instruction-Tuning Data Curation

Arxiv

0+阅读 · 2023年5月23日

Domain Private Transformers

Arxiv

0+阅读 · 2023年5月23日

Improving Robustness in Knowledge Distillation Using Domain-Targeted Data Augmentation

Arxiv

0+阅读 · 2023年5月22日

Pengi: An Audio Language Model for Audio Tasks

Arxiv

0+阅读 · 2023年5月19日

Empower Large Language Model to Perform Better on Industrial Domain-Specific Question Answering

Arxiv

0+阅读 · 2023年5月19日

Zero-Shot Text Classification via Self-Supervised Tuning

Arxiv

0+阅读 · 2023年5月19日

Leveraging ChatGPT for Power System Programming Tasks

Arxiv

1+阅读 · 2023年5月18日

Augmented Large Language Models with Parametric Knowledge Guiding

Arxiv

20+阅读 · 2023年5月8日

Self-correcting Q-Learning

Arxiv

11+阅读 · 2020年12月2日

相关基金

受体MDSCs通过CEACAM1-TIM3调控NK细胞功能介导肝移植免疫耐受的机制研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于元胞自动机和数据同化的溢油模拟

国家自然科学基金

0+阅读 · 2013年12月31日

c-Myc-GPC5通路调控前列腺癌进展的分子机理

国家自然科学基金

0+阅读 · 2013年12月31日

数据驱动的三维城市建筑矢量化建模研究

国家自然科学基金

0+阅读 · 2013年12月31日

数据分析中的大规模矩阵优化模型求解算法研究

国家自然科学基金

2+阅读 · 2013年12月31日

低温胁迫下甘蓝型油菜种子萌发出苗的生化反应及调控机制研究

国家自然科学基金

0+阅读 · 2013年12月31日

水稻CIC1蛋白调节光合作用低温适应的分子机理研究

国家自然科学基金

0+阅读 · 2012年12月31日

高能物理数据分析的Hadoop/HBASE平台研究

国家自然科学基金

1+阅读 · 2012年12月31日

耦合多源数据的森林碳水通量模型驱动参数同化机制

国家自然科学基金

0+阅读 · 2012年12月31日

基于C-PolInSAR和PolInSAR的森林垂直结构参数反演

国家自然科学基金

0+阅读 · 2009年12月31日

微信扫码咨询专知VIP会员