【CMU博士论文】分析多模态机器学习模型性能及其在医学报告生成中的评估指标 - 专知VIP

会员服务 ·

16

CMU · 博士论文 · 多模态机器学习 · 医学报告生成 ·

2024 年 12 月 16 日

【CMU博士论文】分析多模态机器学习模型性能及其在医学报告生成中的评估指标

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

随着基础模型（包括大规模视觉语言模型）的最新进展，许多研究者探讨了将多模态数据作为视觉问答输入的结合方法。在医疗领域，视觉问答的一个关键应用是自动化医学报告生成，其中可能提供胸部X光图像和患者基于文本的症状数据，目的是生成相关的医学报告。然而，很少有研究分析这些模型与单模态微调的大型语言模型（LLM）的性能差异，更少有研究比较这些多模态模型在提供症状信息作为输入时的表现。此外，过去的研究通常使用简单的评估指标，如n-gram重叠（例如BLEU和ROUGE分数），这些指标对于能够生成不同句子但具有相同语义意义的生成式基础模型并不有效。本文的主要贡献有两个。首先，我们比较了多种医学报告生成方法在胸部X光医学报告数据集上的表现，包括单模态微调的医学LLM、没有症状数据的多模态模型和包含症状数据的多模态模型。其次，我们引入了四种新的评估指标，用于评估生成医学报告与参考医学报告之间的相似性，分别为：单词对、句子平均、句子对和句子对（生物）。我们的结果表明，针对医学报告生成的多模态方法远优于单模态方法，且提供症状数据略微提高了生成报告的准确性。我们还发现，我们新提出的句子对评估指标比所有之前的指标更能准确衡量生成报告与参考报告之间的相似性，这一点通过全面的定量和定性案例研究对比得到了证实。这项研究从根本上推动了医学报告生成的前沿，进一步增强了使用多模态模型和症状输入的准确性优势，并引入了几种更为全面、定制化的评估生成医学报告的评分指标。

成为VIP会员查看完整内容

21

相关内容

CMU

【NTU博士论文】基于深度生成模型的图像恢复与表示

【NTU博士论文】基于深度生成模型的图像恢复与表示

专知会员服务

19+阅读 · 2月23日

【HKUST博士论文】基于生成模型的高保真图像与视频编辑

【HKUST博士论文】基于生成模型的高保真图像与视频编辑

专知会员服务

15+阅读 · 1月23日

【ETHZ博士论文】用于场景生成的3D生成模型

【ETHZ博士论文】用于场景生成的3D生成模型

专知会员服务

21+阅读 · 2024年12月12日

【ETHZ博士论文】用于视觉场景理解的领域鲁棒网络架构与训练策略

【ETHZ博士论文】用于视觉场景理解的领域鲁棒网络架构与训练策略

专知会员服务

27+阅读 · 2024年10月29日

【CMU博士论文】利用结构化中间表示构建可靠且透明的机器学习系统

【CMU博士论文】利用结构化中间表示构建可靠且透明的机器学习系统

专知会员服务

28+阅读 · 2024年9月19日

【MIT博士论文】非线性优化在机器学习应用中的平滑性与自适应性

【MIT博士论文】非线性优化在机器学习应用中的平滑性与自适应性

专知会员服务

25+阅读 · 2024年8月27日

【MIT博士论文】大规模机器学习算法：效率、估计误差及其拓展

【MIT博士论文】大规模机器学习算法：效率、估计误差及其拓展

专知会员服务

28+阅读 · 2024年8月3日

【CMU博士论文】通过可解释的层级操作实现基础自然语言生成

【CMU博士论文】通过可解释的层级操作实现基础自然语言生成

专知会员服务

18+阅读 · 2024年7月24日

【UIUC博士论文】生成式深度学习：走向更好的视觉表征和多模态

【UIUC博士论文】生成式深度学习：走向更好的视觉表征和多模态

专知会员服务

43+阅读 · 2024年2月2日

【ETHZ博士论文】利用多模态数据在计算机视觉中的应用，涉及超分辨率和分类

【ETHZ博士论文】利用多模态数据在计算机视觉中的应用，涉及超分辨率和分类

专知会员服务

42+阅读 · 2023年11月16日

【佐治亚理工博士论文】基于策略智能体和有限反馈的序列决策，211页pdf

【佐治亚理工博士论文】基于策略智能体和有限反馈的序列决策，211页pdf

专知

38+阅读 · 2023年4月13日

港科大浙大最新《深度生成模型三维表示》综述，20页pdf全面阐述3D生成进展

港科大浙大最新《深度生成模型三维表示》综述，20页pdf全面阐述3D生成进展

专知

12+阅读 · 2022年10月31日

数据受限条件下的多模态处理技术综述

数据受限条件下的多模态处理技术综述

专知

20+阅读 · 2022年7月16日

【MIT博士论文】数据高效强化学习，176页pdf

【MIT博士论文】数据高效强化学习，176页pdf

专知

18+阅读 · 2022年7月11日

NLP如何用元学习？李宏毅老师NAACL2022最新《元学习自然语言处理》综述论文阐述最新研究进展

NLP如何用元学习？李宏毅老师NAACL2022最新《元学习自然语言处理》综述论文阐述最新研究进展

专知

24+阅读 · 2022年5月4日

【博士论文】多任务学习视觉场景理解，140页pdf

【博士论文】多任务学习视觉场景理解，140页pdf

专知

28+阅读 · 2022年4月5日

图神经网络如何时序化？看Twitter最新《动态图深度学习:时序图网络TGN》研究，附论文与PPT下载

图神经网络如何时序化？看Twitter最新《动态图深度学习:时序图网络TGN》研究，附论文与PPT下载

专知

17+阅读 · 2021年1月24日

最新《图嵌入组合优化》综述论文，40页pdf

最新《图嵌入组合优化》综述论文，40页pdf

专知

39+阅读 · 2020年8月31日

【浙大博士论文】面向复杂场景理解的视觉内容识别、检测与推理方法研究

【浙大博士论文】面向复杂场景理解的视觉内容识别、检测与推理方法研究

专知

26+阅读 · 2020年7月26日

【伯克利PNAS最新论文】可解释机器学习的定义、方法和应用

【伯克利PNAS最新论文】可解释机器学习的定义、方法和应用

专知

77+阅读 · 2019年10月20日

间接优化的高效Monte Carlo声传播研究

国家自然科学基金

0+阅读 · 2017年12月31日

功能磁共振成像无监督模式分析方法及应用

国家自然科学基金

3+阅读 · 2015年12月31日

心脏的多形态耦合与层级级联计算可视化方法的研究

国家自然科学基金

1+阅读 · 2015年12月31日

材料与加工敏感的形状分析与建模

国家自然科学基金

0+阅读 · 2015年12月31日

基于对称识别方法的贝叶斯probit模型稳健性研究

国家自然科学基金

3+阅读 · 2015年12月31日

基于云计算平台的下一代测序数据错误修正算法研究与实现

国家自然科学基金

2+阅读 · 2015年12月31日

面向健康管理数据的关联型知识深度挖掘方法研究

国家自然科学基金

11+阅读 · 2015年12月31日

网状meta分析实效性评价方法及其广义线性混合效应模型的构建与应用研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向大数据的安全迁移学习方法

国家自然科学基金

28+阅读 · 2015年12月31日

项目知识情境提取与展现方法研究：基于主题模型和知识地图的大数据视角

国家自然科学基金

2+阅读 · 2014年12月31日

Is ChatGPT a Good Recommender? A Preliminary Study

Arxiv

171+阅读 · 2023年4月20日

NeuralField-LDM: Scene Generation with Hierarchical Latent Diffusion Models

Arxiv

42+阅读 · 2023年4月19日

A Comprehensive Survey on Deep Graph Representation Learning

Arxiv

103+阅读 · 2023年4月11日

On Efficient Training of Large-Scale Deep Learning Models: A Literature Review

Arxiv

216+阅读 · 2023年4月7日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

477+阅读 · 2023年3月31日

Knowledge Graphs: Opportunities and Challenges

Arxiv

174+阅读 · 2023年3月24日

Revolutionizing Modern Networks: Advances in AI, Machine Learning, and Blockchain for Quantum Satellites and UAV-based Communication

Arxiv

32+阅读 · 2023年3月21日

A Complete Survey on Generative AI (AIGC): Is ChatGPT from GPT-4 to GPT-5 All You Need?

Arxiv

84+阅读 · 2023年3月21日

Data-centric Artificial Intelligence: A Survey

Arxiv

24+阅读 · 2023年3月17日

A survey and taxonomy of loss functions in machine learning

Arxiv

26+阅读 · 2023年1月13日

VIP会员

相关主题

多模态机器学习

医学报告生成

相关VIP内容

【NTU博士论文】基于深度生成模型的图像恢复与表示

【NTU博士论文】基于深度生成模型的图像恢复与表示

专知会员服务

19+阅读 · 2月23日

【HKUST博士论文】基于生成模型的高保真图像与视频编辑

【HKUST博士论文】基于生成模型的高保真图像与视频编辑

专知会员服务

15+阅读 · 1月23日

【ETHZ博士论文】用于场景生成的3D生成模型

【ETHZ博士论文】用于场景生成的3D生成模型

专知会员服务

21+阅读 · 2024年12月12日

【ETHZ博士论文】用于视觉场景理解的领域鲁棒网络架构与训练策略

【ETHZ博士论文】用于视觉场景理解的领域鲁棒网络架构与训练策略

专知会员服务

27+阅读 · 2024年10月29日

【CMU博士论文】利用结构化中间表示构建可靠且透明的机器学习系统

【CMU博士论文】利用结构化中间表示构建可靠且透明的机器学习系统

专知会员服务

28+阅读 · 2024年9月19日

【MIT博士论文】非线性优化在机器学习应用中的平滑性与自适应性

【MIT博士论文】非线性优化在机器学习应用中的平滑性与自适应性

专知会员服务

25+阅读 · 2024年8月27日

【MIT博士论文】大规模机器学习算法：效率、估计误差及其拓展

【MIT博士论文】大规模机器学习算法：效率、估计误差及其拓展

专知会员服务

28+阅读 · 2024年8月3日

【CMU博士论文】通过可解释的层级操作实现基础自然语言生成

【CMU博士论文】通过可解释的层级操作实现基础自然语言生成

专知会员服务

18+阅读 · 2024年7月24日

【UIUC博士论文】生成式深度学习：走向更好的视觉表征和多模态

【UIUC博士论文】生成式深度学习：走向更好的视觉表征和多模态

专知会员服务

43+阅读 · 2024年2月2日

【ETHZ博士论文】利用多模态数据在计算机视觉中的应用，涉及超分辨率和分类

【ETHZ博士论文】利用多模态数据在计算机视觉中的应用，涉及超分辨率和分类

专知会员服务

42+阅读 · 2023年11月16日

热门VIP内容

开通专知VIP会员享更多权益服务

【博士论文】低维与高维空间中潜在表征的分析、建模与变换

《生态建模密码破译：建模与编程实践》美陆军最新报告

大模型解决方案白皮书：社交陪伴场景全流程落地指南

面向具身操作的视觉-语言-动作模型综述

相关资讯

【佐治亚理工博士论文】基于策略智能体和有限反馈的序列决策，211页pdf

【佐治亚理工博士论文】基于策略智能体和有限反馈的序列决策，211页pdf

专知

38+阅读 · 2023年4月13日

港科大浙大最新《深度生成模型三维表示》综述，20页pdf全面阐述3D生成进展

港科大浙大最新《深度生成模型三维表示》综述，20页pdf全面阐述3D生成进展

专知

12+阅读 · 2022年10月31日

数据受限条件下的多模态处理技术综述

数据受限条件下的多模态处理技术综述

专知

20+阅读 · 2022年7月16日

【MIT博士论文】数据高效强化学习，176页pdf

【MIT博士论文】数据高效强化学习，176页pdf

专知

18+阅读 · 2022年7月11日

NLP如何用元学习？李宏毅老师NAACL2022最新《元学习自然语言处理》综述论文阐述最新研究进展

NLP如何用元学习？李宏毅老师NAACL2022最新《元学习自然语言处理》综述论文阐述最新研究进展

专知

24+阅读 · 2022年5月4日

【博士论文】多任务学习视觉场景理解，140页pdf

【博士论文】多任务学习视觉场景理解，140页pdf

专知

28+阅读 · 2022年4月5日

图神经网络如何时序化？看Twitter最新《动态图深度学习:时序图网络TGN》研究，附论文与PPT下载

图神经网络如何时序化？看Twitter最新《动态图深度学习:时序图网络TGN》研究，附论文与PPT下载

专知

17+阅读 · 2021年1月24日

最新《图嵌入组合优化》综述论文，40页pdf

最新《图嵌入组合优化》综述论文，40页pdf

专知

39+阅读 · 2020年8月31日

【浙大博士论文】面向复杂场景理解的视觉内容识别、检测与推理方法研究

【浙大博士论文】面向复杂场景理解的视觉内容识别、检测与推理方法研究

专知

26+阅读 · 2020年7月26日

【伯克利PNAS最新论文】可解释机器学习的定义、方法和应用

【伯克利PNAS最新论文】可解释机器学习的定义、方法和应用

专知

77+阅读 · 2019年10月20日

相关基金

间接优化的高效Monte Carlo声传播研究

国家自然科学基金

0+阅读 · 2017年12月31日

功能磁共振成像无监督模式分析方法及应用

国家自然科学基金

3+阅读 · 2015年12月31日

心脏的多形态耦合与层级级联计算可视化方法的研究

国家自然科学基金

1+阅读 · 2015年12月31日

材料与加工敏感的形状分析与建模

国家自然科学基金

0+阅读 · 2015年12月31日

基于对称识别方法的贝叶斯probit模型稳健性研究

国家自然科学基金

3+阅读 · 2015年12月31日

基于云计算平台的下一代测序数据错误修正算法研究与实现

国家自然科学基金

2+阅读 · 2015年12月31日

面向健康管理数据的关联型知识深度挖掘方法研究

国家自然科学基金

11+阅读 · 2015年12月31日

网状meta分析实效性评价方法及其广义线性混合效应模型的构建与应用研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向大数据的安全迁移学习方法

国家自然科学基金

28+阅读 · 2015年12月31日

项目知识情境提取与展现方法研究：基于主题模型和知识地图的大数据视角

国家自然科学基金

2+阅读 · 2014年12月31日

相关论文

Is ChatGPT a Good Recommender? A Preliminary Study

Arxiv

171+阅读 · 2023年4月20日

NeuralField-LDM: Scene Generation with Hierarchical Latent Diffusion Models

Arxiv

42+阅读 · 2023年4月19日

A Comprehensive Survey on Deep Graph Representation Learning

Arxiv

103+阅读 · 2023年4月11日

On Efficient Training of Large-Scale Deep Learning Models: A Literature Review

Arxiv

216+阅读 · 2023年4月7日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

477+阅读 · 2023年3月31日

Knowledge Graphs: Opportunities and Challenges

Arxiv

174+阅读 · 2023年3月24日

Revolutionizing Modern Networks: Advances in AI, Machine Learning, and Blockchain for Quantum Satellites and UAV-based Communication

Arxiv

32+阅读 · 2023年3月21日

A Complete Survey on Generative AI (AIGC): Is ChatGPT from GPT-4 to GPT-5 All You Need?

Arxiv

84+阅读 · 2023年3月21日

Data-centric Artificial Intelligence: A Survey

Arxiv

24+阅读 · 2023年3月17日

A survey and taxonomy of loss functions in machine learning

Arxiv

26+阅读 · 2023年1月13日

微信扫码咨询专知VIP会员