【MIT博士论文】医学人工智能中的自然语言基础模型 - 专知VIP

会员服务 ·

4

医疗人工智能 · 自然语言基础模型 ·

【MIT博士论文】医学人工智能中的自然语言基础模型

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

在过去的十年里，深度学习，特别是大语言模型（LLMs）的变革性崛起，激发了各个领域的专家深入思考人工智能（AI）如何革新他们的领域。在这段时间里，通用基础模型而非狭窄且高度专业化的任务特定系统，开始成为主流范式。在医疗健康领域，AI系统已经在多种实际应用场景中得到了广泛实施，尽管这些系统可能没有经过充分的评估和验证。事实上，它们在处理自然语言方面的卓越能力——自然语言在医学中是知识和沟通的关键媒介——表明这些现代基础模型在医疗领域中可能具有巨大的潜力。然而，仍然需要更好地研究和理解它们的优点、局限性和鲁棒性，特别是在更现实和临床相关的环境中。本文聚焦于两类关键的自然语言驱动的基础模型——对比语言图像预训练（CLIP）模型和大语言模型（LLMs）——并探讨这些模型如何编码和传递有用的临床知识，用于如胸部X光解读、鉴别诊断、病史采集和临床管理等任务。总体而言，本文旨在进一步增进我们对自然语言基础模型在医学中的潜力的集体理解，同时强调需要进行大量的进一步研究，以应对现实世界的挑战，并理解这些系统可以安全有效地实施的范围。

在第一章中，我提供了一些相关背景的概述，包括对比语言-图像预训练模型、大语言模型及其在医学领域的评估。在第二章中，我们通过在预训练过程中应用一种新颖的正则化技术，改进了CLIP架构，以用于胸部X光解读，并使用该模型进行胸部X光发现的零样本识别。在第三章中，我们考察了CLIP风格模型的可靠性。首先，我们评估了它们对捷径学习的鲁棒性，以理解文本自监督可能带来的保护效果。接着，我们探索了如何利用共形预测来控制零样本分类性能，并为这些CLIP风格模型预见兼容输入。在第四章中，我描述了Articulate Medical Intelligence Explorer（AMIE）的开发，这是一个经过模拟医学对话微调的对话诊断AI。我们在两项随机研究中评估了AMIE的诊断能力；首先是在具有挑战性的临床病理会议（CPC）案例中，其次是在虚拟文本基础的客观结构化临床考试（OSCE）中。在第五章中，我们探讨了AMIE在两个子专业领域的管理推理能力：遗传性心血管疾病和乳腺肿瘤学。在这些研究中，我们设计了特定领域的案例管理评估，并将AMIE的表现与在子专业评估下的全科医生进行比较，同时研究其潜在的辅助效应。

https://dspace.mit.edu/handle/1721.1/158802

成为VIP会员查看完整内容

8

相关内容

医疗人工智能

医疗人工智能

【博士论文】深度神经网络的统计物理学：泛化能力、超越无限宽度和特征学习

【博士论文】深度神经网络的统计物理学：泛化能力、超越无限宽度和特征学习

专知会员服务

26+阅读 · 2月4日

【博士论文】面向数据的语言生成模型研究

【博士论文】面向数据的语言生成模型研究

专知会员服务

23+阅读 · 1月19日

【博士论文】面向忠实度的新型可解释性范式在自然语言处理中的应用

【博士论文】面向忠实度的新型可解释性范式在自然语言处理中的应用

专知会员服务

20+阅读 · 2024年12月24日

【CMU博士论文】分析多模态机器学习模型性能及其在医学报告生成中的评估指标

【CMU博士论文】分析多模态机器学习模型性能及其在医学报告生成中的评估指标

专知会员服务

21+阅读 · 2024年12月16日

【博士论文】高效且有效的基础大型多模态模型学习

【博士论文】高效且有效的基础大型多模态模型学习

专知会员服务

38+阅读 · 2024年10月21日

【CMU博士论文】利用结构化中间表示构建可靠且透明的机器学习系统

【CMU博士论文】利用结构化中间表示构建可靠且透明的机器学习系统

专知会员服务

27+阅读 · 2024年9月19日

【CMU博士论文】现代深度学习高效训练策略的进展：从隐式深度学习到语言模型及其拓展领域

【CMU博士论文】现代深度学习高效训练策略的进展：从隐式深度学习到语言模型及其拓展领域

专知会员服务

20+阅读 · 2024年7月5日

【博士论文】自然语言处理不确定估计

【博士论文】自然语言处理不确定估计

专知会员服务

22+阅读 · 2024年5月22日

【ETHZ博士论文】样本高效的基于模型的强化学习：零阶轨迹优化、策略蒸馏和距离学习的分析

【ETHZ博士论文】样本高效的基于模型的强化学习：零阶轨迹优化、策略蒸馏和距离学习的分析

专知会员服务

42+阅读 · 2023年12月6日

【ETHZ博士论文】利用多模态数据在计算机视觉中的应用，涉及超分辨率和分类

【ETHZ博士论文】利用多模态数据在计算机视觉中的应用，涉及超分辨率和分类

专知会员服务

42+阅读 · 2023年11月16日

【佐治亚理工博士论文】基于策略智能体和有限反馈的序列决策，211页pdf

【佐治亚理工博士论文】基于策略智能体和有限反馈的序列决策，211页pdf

专知

36+阅读 · 2023年4月13日

【集群机器人】《考虑敌手的多智能体系统协同任务分配与运动规划》2022最新226页博士论文，密歇根大学

【集群机器人】《考虑敌手的多智能体系统协同任务分配与运动规划》2022最新226页博士论文，密歇根大学

专知

25+阅读 · 2022年11月23日

推荐！【中文版】《人工智能在军事应用中的可能性和挑战》瑞典国防研究局16页报告

推荐！【中文版】《人工智能在军事应用中的可能性和挑战》瑞典国防研究局16页报告

专知

79+阅读 · 2022年7月29日

【MIT博士论文】数据高效强化学习，176页pdf

【MIT博士论文】数据高效强化学习，176页pdf

专知

17+阅读 · 2022年7月11日

【AI+医学】多模态深度学习在生物医学数据融合中的应用研究进展，瑞典舍午德大学

【AI+医学】多模态深度学习在生物医学数据融合中的应用研究进展，瑞典舍午德大学

专知

13+阅读 · 2022年5月31日

NLP如何用元学习？李宏毅老师NAACL2022最新《元学习自然语言处理》综述论文阐述最新研究进展

NLP如何用元学习？李宏毅老师NAACL2022最新《元学习自然语言处理》综述论文阐述最新研究进展

专知

24+阅读 · 2022年5月4日

图神经网络如何时序化？看Twitter最新《动态图深度学习:时序图网络TGN》研究，附论文与PPT下载

图神经网络如何时序化？看Twitter最新《动态图深度学习:时序图网络TGN》研究，附论文与PPT下载

专知

16+阅读 · 2021年1月24日

【浙大博士论文】面向复杂场景理解的视觉内容识别、检测与推理方法研究

【浙大博士论文】面向复杂场景理解的视觉内容识别、检测与推理方法研究

专知

25+阅读 · 2020年7月26日

【伯克利PNAS最新论文】可解释机器学习的定义、方法和应用

【伯克利PNAS最新论文】可解释机器学习的定义、方法和应用

专知

76+阅读 · 2019年10月20日

每日论文 | 图形深度神经网络并行框架NGra；用人类注意力进行序列分类；针对多智能体协作的图卷积强化学习

每日论文 | 图形深度神经网络并行框架NGra；用人类注意力进行序列分类；针对多智能体协作的图卷积强化学习

论智

26+阅读 · 2018年10月30日

内容中心无线网络的存储和传输协作机制研究

国家自然科学基金

1+阅读 · 2017年12月31日

面向跨领域异构数据的患者相似性学习方法及应用

国家自然科学基金

23+阅读 · 2016年12月31日

基于云计算平台的下一代测序数据错误修正算法研究与实现

国家自然科学基金

2+阅读 · 2015年12月31日

大规模MIMO系统基于结构化压缩感知的信道估计中导频设计新方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

多尺度模块网络下的储备池神经计算模型及算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

大规模模糊RDF数据管理关键技术研究

国家自然科学基金

7+阅读 · 2015年12月31日

面向健康管理数据的关联型知识深度挖掘方法研究

国家自然科学基金

9+阅读 · 2015年12月31日

面向存储受限应用的GPU性能预测模型和通信优化关键技术研究

国家自然科学基金

2+阅读 · 2015年12月31日

高密度三维存储器件集成中的基础科学问题研究

国家自然科学基金

0+阅读 · 2014年12月31日

小鼠锰离子增强脑成像（MEMRI）数据分析算法研究及应用

国家自然科学基金

0+阅读 · 2014年12月31日

Is ChatGPT a Good Recommender? A Preliminary Study

Arxiv

165+阅读 · 2023年4月20日

A Comprehensive Survey on Deep Graph Representation Learning

Arxiv

98+阅读 · 2023年4月11日

On Efficient Training of Large-Scale Deep Learning Models: A Literature Review

Arxiv

203+阅读 · 2023年4月7日

One Small Step for Generative AI, One Giant Leap for AGI: A Complete Survey on ChatGPT in AIGC Era

Arxiv

49+阅读 · 2023年4月4日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

448+阅读 · 2023年3月31日

Nature Language Reasoning, A Survey

Arxiv

75+阅读 · 2023年3月26日

Knowledge Graphs: Opportunities and Challenges

Arxiv

163+阅读 · 2023年3月24日

Sparks of Artificial General Intelligence: Early experiments with GPT-4

Arxiv

47+阅读 · 2023年3月22日

A Complete Survey on Generative AI (AIGC): Is ChatGPT from GPT-4 to GPT-5 All You Need?

Arxiv

80+阅读 · 2023年3月21日

Data-centric Artificial Intelligence: A Survey

Arxiv

24+阅读 · 2023年3月17日

VIP会员

相关主题

医疗人工智能

自然语言基础模型

相关VIP内容

【博士论文】深度神经网络的统计物理学：泛化能力、超越无限宽度和特征学习

【博士论文】深度神经网络的统计物理学：泛化能力、超越无限宽度和特征学习

专知会员服务

26+阅读 · 2月4日

【博士论文】面向数据的语言生成模型研究

【博士论文】面向数据的语言生成模型研究

专知会员服务

23+阅读 · 1月19日

【博士论文】面向忠实度的新型可解释性范式在自然语言处理中的应用

【博士论文】面向忠实度的新型可解释性范式在自然语言处理中的应用

专知会员服务

20+阅读 · 2024年12月24日

【CMU博士论文】分析多模态机器学习模型性能及其在医学报告生成中的评估指标

【CMU博士论文】分析多模态机器学习模型性能及其在医学报告生成中的评估指标

专知会员服务

21+阅读 · 2024年12月16日

【博士论文】高效且有效的基础大型多模态模型学习

【博士论文】高效且有效的基础大型多模态模型学习

专知会员服务

38+阅读 · 2024年10月21日

【CMU博士论文】利用结构化中间表示构建可靠且透明的机器学习系统

【CMU博士论文】利用结构化中间表示构建可靠且透明的机器学习系统

专知会员服务

27+阅读 · 2024年9月19日

【CMU博士论文】现代深度学习高效训练策略的进展：从隐式深度学习到语言模型及其拓展领域

【CMU博士论文】现代深度学习高效训练策略的进展：从隐式深度学习到语言模型及其拓展领域

专知会员服务

20+阅读 · 2024年7月5日

【博士论文】自然语言处理不确定估计

【博士论文】自然语言处理不确定估计

专知会员服务

22+阅读 · 2024年5月22日

【ETHZ博士论文】样本高效的基于模型的强化学习：零阶轨迹优化、策略蒸馏和距离学习的分析

【ETHZ博士论文】样本高效的基于模型的强化学习：零阶轨迹优化、策略蒸馏和距离学习的分析

专知会员服务

42+阅读 · 2023年12月6日

【ETHZ博士论文】利用多模态数据在计算机视觉中的应用，涉及超分辨率和分类

【ETHZ博士论文】利用多模态数据在计算机视觉中的应用，涉及超分辨率和分类

专知会员服务

42+阅读 · 2023年11月16日

热门VIP内容

开通专知VIP会员享更多权益服务

现代化C4ISR体系：应对复杂战场形态的演进

美陆军2025年新版条令《作战》296页

《基于学习的下一代智能网络优化方法》180页

《协同式自主海上系统制导、导航与控制（GNC）架构》174页

相关资讯

【佐治亚理工博士论文】基于策略智能体和有限反馈的序列决策，211页pdf

【佐治亚理工博士论文】基于策略智能体和有限反馈的序列决策，211页pdf

专知

36+阅读 · 2023年4月13日

【集群机器人】《考虑敌手的多智能体系统协同任务分配与运动规划》2022最新226页博士论文，密歇根大学

【集群机器人】《考虑敌手的多智能体系统协同任务分配与运动规划》2022最新226页博士论文，密歇根大学

专知

25+阅读 · 2022年11月23日

推荐！【中文版】《人工智能在军事应用中的可能性和挑战》瑞典国防研究局16页报告

推荐！【中文版】《人工智能在军事应用中的可能性和挑战》瑞典国防研究局16页报告

专知

79+阅读 · 2022年7月29日

【MIT博士论文】数据高效强化学习，176页pdf

【MIT博士论文】数据高效强化学习，176页pdf

专知

17+阅读 · 2022年7月11日

【AI+医学】多模态深度学习在生物医学数据融合中的应用研究进展，瑞典舍午德大学

【AI+医学】多模态深度学习在生物医学数据融合中的应用研究进展，瑞典舍午德大学

专知

13+阅读 · 2022年5月31日

NLP如何用元学习？李宏毅老师NAACL2022最新《元学习自然语言处理》综述论文阐述最新研究进展

NLP如何用元学习？李宏毅老师NAACL2022最新《元学习自然语言处理》综述论文阐述最新研究进展

专知

24+阅读 · 2022年5月4日

图神经网络如何时序化？看Twitter最新《动态图深度学习:时序图网络TGN》研究，附论文与PPT下载

图神经网络如何时序化？看Twitter最新《动态图深度学习:时序图网络TGN》研究，附论文与PPT下载

专知

16+阅读 · 2021年1月24日

【浙大博士论文】面向复杂场景理解的视觉内容识别、检测与推理方法研究

【浙大博士论文】面向复杂场景理解的视觉内容识别、检测与推理方法研究

专知

25+阅读 · 2020年7月26日

【伯克利PNAS最新论文】可解释机器学习的定义、方法和应用

【伯克利PNAS最新论文】可解释机器学习的定义、方法和应用

专知

76+阅读 · 2019年10月20日

每日论文 | 图形深度神经网络并行框架NGra；用人类注意力进行序列分类；针对多智能体协作的图卷积强化学习

每日论文 | 图形深度神经网络并行框架NGra；用人类注意力进行序列分类；针对多智能体协作的图卷积强化学习

论智

26+阅读 · 2018年10月30日

相关基金

内容中心无线网络的存储和传输协作机制研究

国家自然科学基金

1+阅读 · 2017年12月31日

面向跨领域异构数据的患者相似性学习方法及应用

国家自然科学基金

23+阅读 · 2016年12月31日

基于云计算平台的下一代测序数据错误修正算法研究与实现

国家自然科学基金

2+阅读 · 2015年12月31日

大规模MIMO系统基于结构化压缩感知的信道估计中导频设计新方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

多尺度模块网络下的储备池神经计算模型及算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

大规模模糊RDF数据管理关键技术研究

国家自然科学基金

7+阅读 · 2015年12月31日

面向健康管理数据的关联型知识深度挖掘方法研究

国家自然科学基金

9+阅读 · 2015年12月31日

面向存储受限应用的GPU性能预测模型和通信优化关键技术研究

国家自然科学基金

2+阅读 · 2015年12月31日

高密度三维存储器件集成中的基础科学问题研究

国家自然科学基金

0+阅读 · 2014年12月31日

小鼠锰离子增强脑成像（MEMRI）数据分析算法研究及应用

国家自然科学基金

0+阅读 · 2014年12月31日

相关论文

Is ChatGPT a Good Recommender? A Preliminary Study

Arxiv

165+阅读 · 2023年4月20日

A Comprehensive Survey on Deep Graph Representation Learning

Arxiv

98+阅读 · 2023年4月11日

On Efficient Training of Large-Scale Deep Learning Models: A Literature Review

Arxiv

203+阅读 · 2023年4月7日

One Small Step for Generative AI, One Giant Leap for AGI: A Complete Survey on ChatGPT in AIGC Era

Arxiv

49+阅读 · 2023年4月4日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

448+阅读 · 2023年3月31日

Nature Language Reasoning, A Survey

Arxiv

75+阅读 · 2023年3月26日

Knowledge Graphs: Opportunities and Challenges

Arxiv

163+阅读 · 2023年3月24日

Sparks of Artificial General Intelligence: Early experiments with GPT-4

Arxiv

47+阅读 · 2023年3月22日

A Complete Survey on Generative AI (AIGC): Is ChatGPT from GPT-4 to GPT-5 All You Need?

Arxiv

80+阅读 · 2023年3月21日

Data-centric Artificial Intelligence: A Survey

Arxiv

24+阅读 · 2023年3月17日

微信扫码咨询专知VIP会员