我们对世界的体验是多模态的——我们看到物体,听到声音,感觉到纹理,闻到气味,尝到味道。模态是指某件事情发生或经历的方式,一个研究问题如果包含多个模态,就被称为多模态。为了让人工智能在理解我们周围的世界方面取得进展,它需要能够一起解释这种多模态信号。多模态机器学习旨在建立能够处理和关联来自多种模式的信息的模型。这是一个日益重要和具有非凡潜力的充满活力的多学科领域。

知识荟萃

多模态机器学习(Multimodal Machine Learning)专知荟萃

综述

模型算法

表示学习

多模态融合

多模态对齐

多模态翻译

Missing or Imperfect Modalities

知识图谱和知识库

可解释学习

生成式学习

半监督学习

自监督学习

语言模型

Adversarial Attacks

小样本学习

应用

语言和视觉问答

Language Grounding in Vision

Language Grouding in Navigation

多模态机器翻译

Multi-agent Communication

常识推理

多模态强化学习

多模态对话

语言和音频

音频和视频

多媒体描述

Video Generation from Text

Affect Recognition and Multimodal Language

医疗

Robotics

WorkShops

Tutorials

视频教程

精品内容

开课了!CMU《多模态机器学习》2023课程,附课件
专知会员服务
73+阅读 · 2023年2月12日
视觉语言多模态预训练综述
专知会员服务
119+阅读 · 2022年7月11日
【AI与医学】多模态机器学习精准医疗健康
专知会员服务
78+阅读 · 2022年4月25日
【Paul Liang】多模态深度学习,Multimodal Deep Learning
专知会员服务
183+阅读 · 2022年4月12日
开课了!CMU《多模态机器学习》2022课程,附课件与视频
专知会员服务
153+阅读 · 2022年2月1日
微信扫码咨询专知VIP会员