多模态学习论文 - 专知

会员服务 ·

多模态学习

多模态学习

现实世界中的信息通常以不同的模态出现。例如，图像通常与标签和文本解释联系在一起;文本包含图像以便更清楚地表达文章的主要思想。不同的模态由迥异的统计特性刻画。例如，图像通常表示为特征提取器的像素强度或输出，而文本则表示为离散的词向量。由于不同信息资源的统计特性不同，发现不同模态之间的关系是非常重要的。多模态学习是一个很好的模型，可以用来表示不同模态的联合表示。多模态学习模型也能在观察到的情况下填补缺失的模态。多模态学习模型中，每个模态对应结合了两个深度玻尔兹曼机（deep boltzmann machines）.另外一个隐藏层被放置在两个玻尔兹曼机上层，以给出联合表示。

Rethinking Multimodal Learning from the Perspective of Mitigating Classification Ability Disproportion

Arxiv

0+阅读 · 10月22日

Expressive and Scalable Quantum Fusion for Multimodal Learning

Arxiv

0+阅读 · 10月8日

IoT-AMLHP: Aligned Multimodal Learning of Header-Payload Representations for Resource-Efficient Malicious IoT Traffic Classification

Arxiv

0+阅读 · 4月21日

DML-RAM: Deep Multimodal Learning Framework for Robotic Arm Manipulation using Pre-trained Models

Arxiv

0+阅读 · 4月4日

Eyes on the Image: Gaze Supervised Multimodal Learning for Chest X-ray Diagnosis and Report Generation

Arxiv

0+阅读 · 8月18日

Multimodal Learning with Uncertainty Quantification based on Discounted Belief Fusion

Multimodal Learning with Uncertainty Quantification based on Discounted Belief Fusion

Arxiv

0+阅读 · 3月28日

Generative Distribution Prediction: A Unified Approach to Multimodal Learning

Arxiv

0+阅读 · 3月9日

MMBind: Unleashing the Potential of Distributed and Heterogeneous Data for Multimodal Learning in IoT

Arxiv

0+阅读 · 3月5日

M2LADS Demo: A System for Generating Multimodal Learning Analytics Dashboards

Arxiv

0+阅读 · 3月14日

Rethinking Multimodal Learning from the Perspective of Mitigating Classification Ability Disproportion

Arxiv

0+阅读 · 2月27日

Towards accurate and reliable ICU outcome prediction: a multimodal learning framework based on belief function theory using structured EHRs and free-text notes

Arxiv

0+阅读 · 2月25日

CPVis: Evidence-based Multimodal Learning Analytics for Evaluation in Collaborative Programming

Arxiv

0+阅读 · 2月25日

Generative Distribution Prediction: A Unified Approach to Multimodal Learning

Arxiv

0+阅读 · 2月10日

EPE-P: Evidence-based Parameter-efficient Prompting for Multimodal Learning with Missing Modalities

Arxiv

1+阅读 · 2024年12月23日

Octavius: Mitigating Task Interference in MLLMs via LoRA-MoE

Arxiv

0+阅读 · 2024年11月25日

参考链接

微信扫码咨询专知VIP会员