多模态学习是否在医疗保健领域提供了通用智能？NUS/北邮/NTU团队发布医疗多模态技术最新综述

论文题目：Has multimodal learning delivered universal intelligence in healthcare? A comprehensive survey

作者单位：新加坡国立大学、北京邮电大学、西北工业大学、西安交通大学、南洋理工大学

论文地址：点击访问

1 引言

人工智能的迅猛发展正在重塑智能健康和智能医疗的版图。多模态学习，作为一种关键的学习技术，因其能够整合互补数据、全面融合信息以及拥有巨大的应用前景而日益受到重视。众多研究者正聚焦于这一领域，开展广泛研究，并构建了众多智能系统。随之而来的一个问题是：多模态学习是否已经在医疗保健领域实现了通用智能？为了解答这一问题，本综述文章从三个独特的视角出发，进行了全面的分析。首先，文章综述了医学多模态学习的研究进展，涵盖了数据集、任务导向方法和通用基础模型三个方面。基于此，文章进一步探讨了五个核心问题，旨在探究先进技术在医疗保健领域的实际影响，从数据和技术层面到效果和挑战。结论是，目前的技术尚未在医疗领域实现通用智能，相关技术仍在不断发展中。最后，根据综述和讨论的结果，文章提出了十个潜在的研究方向，以推动多模态融合技术在医疗保健领域的发展，朝着实现通用智能的目标迈进。

从多模态数据和建模技术的角度到下游任务中的多模态医疗学习 2 面向医疗任务的方法归类

人工智能技术在医疗领域被广泛应用，本文介绍了六个方向上的相关工作：多模态图像融合、医学报告生成、医疗VQA、跨模态检索、文本增强图像处理、跨模态图像生成。

多模态医疗学习的主流应用方向

3 基于对比学习的医疗基础模型（CFMs）

4 多模态医疗大语言模型

5 当前挑战问题

现有的多模式数据能否支持推进智能医疗？
任务导向的方法能有效地解决目标任务吗？
基础模型如何为智能医疗做出贡献？
当前的人工智能模型是否存在伦理问题？
专业人士如何评估当前的多模态人工智能技术？ 6 未来研究方向

根据医疗保健技术的进步和上述讨论，论文概述了以下潜在的未来方向：高质量和多样化的数据、包含更多类型的模态、细粒度和高分辨率的图像建模、有效和高效的知识融合、多模态输入和多模态输出、迈向统一模型、激发基础模型的全部潜力、全面和公正的评估协议、增强面向用户的透明度和可解释性、最大限度地降低道德风险。

成为VIP会员查看完整内容

相关内容

多模态学习

关注 44

现实世界中的信息通常以不同的模态出现。例如，图像通常与标签和文本解释联系在一起;文本包含图像以便更清楚地表达文章的主要思想。不同的模态由迥异的统计特性刻画。例如，图像通常表示为特征提取器的像素强度或输出，而文本则表示为离散的词向量。由于不同信息资源的统计特性不同，发现不同模态之间的关系是非常重要的。多模态学习是一个很好的模型，可以用来表示不同模态的联合表示。多模态学习模型也能在观察到的情况下填补缺失的模态。多模态学习模型中，每个模态对应结合了两个深度玻尔兹曼机（deep boltzmann machines）.另外一个隐藏层被放置在两个玻尔兹曼机上层，以给出联合表示。

一文全面了解证据深度学习 | 中科院《证据深度学习及其应用》综述

专知会员服务

27+阅读 · 9月17日

IJCAI 2024 | 持续多模态知识图谱构建

专知会员服务

25+阅读 · 6月6日

IEEE Proc.｜基于知识图谱的少样本和零样本学习综述

专知会员服务

45+阅读 · 2月2日

Nature速递：基于大语言模型的自动化学研究

专知会员服务

34+阅读 · 1月5日