医生 GLM: 优化中文医生并非艰苦的任务 (DoctorGLM: Fine-tuning your Chinese Doctor is not a Herculean Task) - 专知论文

会员服务 ·

0

ChatGLM-6B · 药物推荐 · ChatGPT · GPT-4 · 大型语言模型 ·

2023 年 4 月 3 日

DoctorGLM: Fine-tuning your Chinese Doctor is not a Herculean Task

翻译：医生 GLM: 优化中文医生并非艰苦的任务

Honglin Xiong,Sheng Wang,Yitao Zhu,Zihao Zhao,Yuxiao Liu,Qian Wang,Dinggang Shen

The recent progress of large language models (LLMs), including ChatGPT and GPT-4, in comprehending and responding to human instructions has been remarkable. Nevertheless, these models typically perform better in English and have not been explicitly trained for the medical domain, resulting in suboptimal precision in diagnoses, drug recommendations, and other medical advice. Additionally, training and deploying a dialogue model is still believed to be impossible for hospitals, hindering the promotion of LLMs. To tackle these challenges, we have collected databases of medical dialogues in Chinese with ChatGPT's help and adopted several techniques to train an easy-deploy LLM. Remarkably, we were able to fine-tune the ChatGLM-6B on a single A100 80G in 13 hours, which means having a healthcare-purpose LLM can be very affordable. DoctorGLM is currently an early-stage engineering attempt and contain various mistakes. We are sharing it with the broader community to invite feedback and suggestions to improve its healthcare-focused capabilities: https://github.com/xionghonglin/DoctorGLM.

翻译：最近，包括ChatGPT和GPT-4在内的大型语言模型（LLM）在理解和响应人类指令方面取得了显着进展。然而，这些模型通常在英语中表现更好，并且尚未明确为医疗领域进行培训，导致诊断、药物推荐和其他医学建议的精度不佳。此外，训练和部署对话模型仍被认为对于医院来说是不可能的事情，阻碍了LLM的推广。为了解决这些挑战，我们使用ChatGPT的帮助收集了中文医学对话的数据库，并采用了几种技术来训练易于部署的医疗LLM。惊人的是，我们能够在单个A100 80G上在13个小时内对ChatGLM-6B进行微调，这意味着拥有面向医疗用途的LLM可能非常实惠。DoctorGLM目前还处于早期工程尝试阶段，存在各种错误。我们正在与广泛的社区分享它，以邀请反馈和建议以改进其医疗重点能力：https://github.com/xionghonglin/DoctorGLM。

2

相关内容

ChatGLM-6B

【2023新书】生成式AI和ChatGPT的兴起:了解生成式AI和ChatGPT如何改变和重塑商业世界，269页pdf

【2023新书】生成式AI和ChatGPT的兴起:了解生成式AI和ChatGPT如何改变和重塑商业世界，269页pdf

专知会员服务

111+阅读 · 2023年5月26日

CVPR 2023 | Prophet: 用小模型启发大语言模型解决外部知识图像问答

CVPR 2023 | Prophet: 用小模型启发大语言模型解决外部知识图像问答

专知会员服务

54+阅读 · 2023年4月1日

百篇论文纵览大型语言模型最新研究进展

百篇论文纵览大型语言模型最新研究进展

专知会员服务

70+阅读 · 2023年3月31日

【2022新书】Python数据分析第三版，579页pdf

【2022新书】Python数据分析第三版，579页pdf

专知会员服务

251+阅读 · 2022年8月31日

2020数据工程师成长路线图

专知会员服务

41+阅读 · 2020年9月6日

【ACL2020】不要停止预训练:根据领域和任务自适应调整语言模型，Don't Stop Pretraining: Adapt Language Models to Domains and Tasks

【ACL2020】不要停止预训练:根据领域和任务自适应调整语言模型，Don't Stop Pretraining: Adapt Language Models to Domains and Tasks

专知会员服务

46+阅读 · 2020年4月25日

100+篇《自监督学习(Self-Supervised Learning)》论文最新合集

100+篇《自监督学习(Self-Supervised Learning)》论文最新合集

专知会员服务

165+阅读 · 2020年3月18日

【经典书】数据挖掘：理论、算法与示例，347页pdf，Nong Ye，Arizona State University

【经典书】数据挖掘：理论、算法与示例，347页pdf，Nong Ye，Arizona State University

专知会员服务

82+阅读 · 2020年2月27日

【医疗AI论文推荐】乳腺癌检测的深度学习模型击败了来自纽约大学和麻省理工学院的5名全职放射科医生和以前的SOTA模型

【医疗AI论文推荐】乳腺癌检测的深度学习模型击败了来自纽约大学和麻省理工学院的5名全职放射科医生和以前的SOTA模型

专知会员服务

30+阅读 · 2019年12月31日

【人工智能在2019：一年回顾】反人工智能，AI in 2019: A Year in Review

【人工智能在2019：一年回顾】反人工智能，AI in 2019: A Year in Review

专知会员服务

79+阅读 · 2019年10月10日

BERT/注意力机制/Transformer/迁移学习NLP资源大列表：awesome-bert-nlp

BERT/注意力机制/Transformer/迁移学习NLP资源大列表：awesome-bert-nlp

AINLP

40+阅读 · 2019年6月9日

Hierarchically Structured Meta-learning

Hierarchically Structured Meta-learning

CreateAMind

27+阅读 · 2019年5月22日

Transferring Knowledge across Learning Processes

Transferring Knowledge across Learning Processes

CreateAMind

29+阅读 · 2019年5月18日

逆强化学习-学习人先验的动机

逆强化学习-学习人先验的动机

CreateAMind

16+阅读 · 2019年1月18日

无监督元学习表示学习

无监督元学习表示学习

CreateAMind

27+阅读 · 2019年1月4日

谷歌发表的史上最强NLP模型BERT的官方代码和预训练模型可以下载了

谷歌发表的史上最强NLP模型BERT的官方代码和预训练模型可以下载了

AINLP

12+阅读 · 2018年11月1日

disentangled-representation-papers

disentangled-representation-papers

CreateAMind

26+阅读 · 2018年9月12日

【干货】初学者的深度学习论文打怪升级指南

【干货】初学者的深度学习论文打怪升级指南

专知

27+阅读 · 2017年12月27日

【推荐】用Python/OpenCV实现增强现实

【推荐】用Python/OpenCV实现增强现实

机器学习研究会

15+阅读 · 2017年11月16日

【推荐】图像分类必读开创性论文汇总

【推荐】图像分类必读开创性论文汇总

机器学习研究会

14+阅读 · 2017年8月15日

肝脏磁共振图像分割的可计算变分模型

国家自然科学基金

0+阅读 · 2015年12月31日

智能化腹部外科术前决策系统的理论与应用研究

国家自然科学基金

2+阅读 · 2014年12月31日

基于UGC的应急响应决策支持系统关键技术研究

国家自然科学基金

12+阅读 · 2014年12月31日

遗传性血管水肿（HAE）临床异质性的分子机制

国家自然科学基金

0+阅读 · 2014年12月31日

常微分方程中的几个经典问题

国家自然科学基金

2+阅读 · 2012年12月31日

基于Linked Open Data的Web服务语义互操作关键技术

国家自然科学基金

0+阅读 · 2012年12月31日

数据质量管理的基础理论与关键技术

国家自然科学基金

3+阅读 · 2011年12月31日

中文句法分析与语义角色标注的联合学习机制研究

国家自然科学基金

1+阅读 · 2009年12月31日

Mather理论与Hamilton-Jacobi方程的粘性解

国家自然科学基金

0+阅读 · 2009年12月31日

Mather理论与Hamilton系统的不稳定性

国家自然科学基金

0+阅读 · 2008年12月31日

Building Resilience in Cybersecurity -- An Artificial Lab Approach

Arxiv

0+阅读 · 2023年5月25日

HuatuoGPT, towards Taming Language Model to Be a Doctor

Arxiv

2+阅读 · 2023年5月24日

ChatAgri: Exploring Potentials of ChatGPT on Cross-linguistic Agricultural Text Classification

Arxiv

0+阅读 · 2023年5月24日

Dynosaur: A Dynamic Growth Paradigm for Instruction-Tuning Data Curation

Arxiv

0+阅读 · 2023年5月23日

Dr.ICL: Demonstration-Retrieved In-context Learning

Arxiv

0+阅读 · 2023年5月23日

GenSpectrum Chat: Data Exploration in Public Health Using Large Language Models

Arxiv

0+阅读 · 2023年5月23日

Distilling Step-by-Step! Outperforming Larger Language Models with Less Training Data and Smaller Model Sizes

Arxiv

22+阅读 · 2023年5月3日

A Comprehensive Survey of AI-Generated Content (AIGC): A History of Generative AI from GAN to ChatGPT

Arxiv

34+阅读 · 2023年3月7日

Learning from Few Samples: A Survey

Learning from Few Samples: A Survey

Arxiv

77+阅读 · 2020年7月30日

Infusing Knowledge into the Textual Entailment Task Using Graph Convolutional Networks

Infusing Knowledge into the Textual Entailment Task Using Graph Convolutional Networks

Arxiv

23+阅读 · 2019年11月5日

VIP会员

文章信息

相关主题

大型语言模型

相关VIP内容

【2023新书】生成式AI和ChatGPT的兴起:了解生成式AI和ChatGPT如何改变和重塑商业世界，269页pdf

【2023新书】生成式AI和ChatGPT的兴起:了解生成式AI和ChatGPT如何改变和重塑商业世界，269页pdf

专知会员服务

111+阅读 · 2023年5月26日

CVPR 2023 | Prophet: 用小模型启发大语言模型解决外部知识图像问答

CVPR 2023 | Prophet: 用小模型启发大语言模型解决外部知识图像问答

专知会员服务

54+阅读 · 2023年4月1日

百篇论文纵览大型语言模型最新研究进展

百篇论文纵览大型语言模型最新研究进展

专知会员服务

70+阅读 · 2023年3月31日

【2022新书】Python数据分析第三版，579页pdf

【2022新书】Python数据分析第三版，579页pdf

专知会员服务

251+阅读 · 2022年8月31日

2020数据工程师成长路线图

专知会员服务

41+阅读 · 2020年9月6日

【ACL2020】不要停止预训练:根据领域和任务自适应调整语言模型，Don't Stop Pretraining: Adapt Language Models to Domains and Tasks

【ACL2020】不要停止预训练:根据领域和任务自适应调整语言模型，Don't Stop Pretraining: Adapt Language Models to Domains and Tasks

专知会员服务

46+阅读 · 2020年4月25日

100+篇《自监督学习(Self-Supervised Learning)》论文最新合集

100+篇《自监督学习(Self-Supervised Learning)》论文最新合集

专知会员服务

165+阅读 · 2020年3月18日

【经典书】数据挖掘：理论、算法与示例，347页pdf，Nong Ye，Arizona State University

【经典书】数据挖掘：理论、算法与示例，347页pdf，Nong Ye，Arizona State University

专知会员服务

82+阅读 · 2020年2月27日

【医疗AI论文推荐】乳腺癌检测的深度学习模型击败了来自纽约大学和麻省理工学院的5名全职放射科医生和以前的SOTA模型

【医疗AI论文推荐】乳腺癌检测的深度学习模型击败了来自纽约大学和麻省理工学院的5名全职放射科医生和以前的SOTA模型

专知会员服务

30+阅读 · 2019年12月31日

【人工智能在2019：一年回顾】反人工智能，AI in 2019: A Year in Review

【人工智能在2019：一年回顾】反人工智能，AI in 2019: A Year in Review

专知会员服务

79+阅读 · 2019年10月10日

热门VIP内容

开通专知VIP会员享更多权益服务

《战区安全决策课程体系》最新244页

《"无人机航母"原型平台》

任务规划与地形分析：现代复杂环境作战导航体系

《攻击场景描述形式化模型研究》

相关资讯

BERT/注意力机制/Transformer/迁移学习NLP资源大列表：awesome-bert-nlp

BERT/注意力机制/Transformer/迁移学习NLP资源大列表：awesome-bert-nlp

AINLP

40+阅读 · 2019年6月9日

Hierarchically Structured Meta-learning

Hierarchically Structured Meta-learning

CreateAMind

27+阅读 · 2019年5月22日

Transferring Knowledge across Learning Processes

Transferring Knowledge across Learning Processes

CreateAMind

29+阅读 · 2019年5月18日

逆强化学习-学习人先验的动机

逆强化学习-学习人先验的动机

CreateAMind

16+阅读 · 2019年1月18日

无监督元学习表示学习

无监督元学习表示学习

CreateAMind

27+阅读 · 2019年1月4日

谷歌发表的史上最强NLP模型BERT的官方代码和预训练模型可以下载了

谷歌发表的史上最强NLP模型BERT的官方代码和预训练模型可以下载了

AINLP

12+阅读 · 2018年11月1日

disentangled-representation-papers

disentangled-representation-papers

CreateAMind

26+阅读 · 2018年9月12日

【干货】初学者的深度学习论文打怪升级指南

【干货】初学者的深度学习论文打怪升级指南

专知

27+阅读 · 2017年12月27日

【推荐】用Python/OpenCV实现增强现实

【推荐】用Python/OpenCV实现增强现实

机器学习研究会

15+阅读 · 2017年11月16日

【推荐】图像分类必读开创性论文汇总

【推荐】图像分类必读开创性论文汇总

机器学习研究会

14+阅读 · 2017年8月15日

相关论文

Building Resilience in Cybersecurity -- An Artificial Lab Approach

Arxiv

0+阅读 · 2023年5月25日

HuatuoGPT, towards Taming Language Model to Be a Doctor

Arxiv

2+阅读 · 2023年5月24日

ChatAgri: Exploring Potentials of ChatGPT on Cross-linguistic Agricultural Text Classification

Arxiv

0+阅读 · 2023年5月24日

Dynosaur: A Dynamic Growth Paradigm for Instruction-Tuning Data Curation

Arxiv

0+阅读 · 2023年5月23日

Dr.ICL: Demonstration-Retrieved In-context Learning

Arxiv

0+阅读 · 2023年5月23日

GenSpectrum Chat: Data Exploration in Public Health Using Large Language Models

Arxiv

0+阅读 · 2023年5月23日

Distilling Step-by-Step! Outperforming Larger Language Models with Less Training Data and Smaller Model Sizes

Arxiv

22+阅读 · 2023年5月3日

A Comprehensive Survey of AI-Generated Content (AIGC): A History of Generative AI from GAN to ChatGPT

Arxiv

34+阅读 · 2023年3月7日

Learning from Few Samples: A Survey

Learning from Few Samples: A Survey

Arxiv

77+阅读 · 2020年7月30日

Infusing Knowledge into the Textual Entailment Task Using Graph Convolutional Networks

Infusing Knowledge into the Textual Entailment Task Using Graph Convolutional Networks

Arxiv

23+阅读 · 2019年11月5日

相关基金

肝脏磁共振图像分割的可计算变分模型

国家自然科学基金

0+阅读 · 2015年12月31日

智能化腹部外科术前决策系统的理论与应用研究

国家自然科学基金

2+阅读 · 2014年12月31日

基于UGC的应急响应决策支持系统关键技术研究

国家自然科学基金

12+阅读 · 2014年12月31日

遗传性血管水肿（HAE）临床异质性的分子机制

国家自然科学基金

0+阅读 · 2014年12月31日

常微分方程中的几个经典问题

国家自然科学基金

2+阅读 · 2012年12月31日

基于Linked Open Data的Web服务语义互操作关键技术

国家自然科学基金

0+阅读 · 2012年12月31日

数据质量管理的基础理论与关键技术

国家自然科学基金

3+阅读 · 2011年12月31日

中文句法分析与语义角色标注的联合学习机制研究

国家自然科学基金

1+阅读 · 2009年12月31日

Mather理论与Hamilton-Jacobi方程的粘性解

国家自然科学基金

0+阅读 · 2009年12月31日

Mather理论与Hamilton系统的不稳定性

国家自然科学基金

0+阅读 · 2008年12月31日

微信扫码咨询专知VIP会员