多模态机器学习(MMML)是一个充满活力的多学科研究领域,通过整合和建模多种交流模态(包括语言、声音和视觉信息)来实现人工智能的一些原始目标。随着对视听语音识别的初步研究,以及最近的语言和视觉项目,如图像和视频字幕,这个研究领域给多模态研究人员带来了一些独特的挑战,因为数据的异质性和模式之间经常发现的偶然性。本课程将教授与MMML相关的基本数学概念,包括多模态对齐与融合、异质表示学习和多流时间建模。我们还将回顾最近描述最先进的MMML概率模型和计算算法的论文,并讨论当前和即将面临的挑战。

本课程将介绍机器学习和深度学习中与多模态机器学习中的五个主要挑战相关的基本数学概念:(1)多模态表示学习,(2)平移与映射,(3)模态对齐,(4)多模态融合和(5)协同学习。这些包括但不限于,多模态自动编码器,深度典型相关分析,多核学习,注意力模型和多模态递归神经网络。本课程还将讨论MMML的许多最新应用,包括多模式的情感识别、图像和视频字幕以及跨模式的多媒体检索。

课程目录:

  • 课程导论
  • 多模态应用与数据集
  • 基本概念:神经网络
  • 网络优化
  • 视觉单模态表示学习
  • 语言单模态表示学习
  • 多模态表示学习
  • 多模态对齐
  • 结构化表示
  • 概率图模型
  • 判别性图模型
  • 神经生成模型
  • 强化学习
  • 多模态强化学习
  • 融合与协同学习
  • 多语言表示学习
成为VIP会员查看完整内容
137

相关内容

我们对世界的体验是多模态的——我们看到物体,听到声音,感觉到纹理,闻到气味,尝到味道。模态是指某件事情发生或经历的方式,一个研究问题如果包含多个模态,就被称为多模态。为了让人工智能在理解我们周围的世界方面取得进展,它需要能够一起解释这种多模态信号。多模态机器学习旨在建立能够处理和关联来自多种模式的信息的模型。这是一个日益重要和具有非凡潜力的充满活力的多学科领域。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等
不可错过!CMU《深度学习导论》2020课程,附课件与视频
专知会员服务
80+阅读 · 2020年10月27日
【CMU】最新深度学习课程, Introduction to Deep Learning
专知会员服务
37+阅读 · 2020年9月12日
最新《统计机器学习》课程,26页ppt
专知会员服务
82+阅读 · 2020年8月30日
【视频】几何数据嵌入表示学习,74页ppt
专知会员服务
34+阅读 · 2020年7月24日
Python导论,476页pdf,现代Python计算
专知会员服务
261+阅读 · 2020年5月17日
Yann Lecun 纽约大学《深度学习(PyTorch)》课程(2020)PPT
专知会员服务
181+阅读 · 2020年3月16日
【课程】概率图模型,卡内基梅隆大学邢波
专知会员服务
70+阅读 · 2019年11月4日
【CMU】机器学习导论课程(Introduction to Machine Learning)
专知会员服务
60+阅读 · 2019年8月26日
这可能是「多模态机器学习」最通俗易懂的介绍
计算机视觉life
113+阅读 · 2018年12月20日
推荐|斯坦福大学面向Tensorflow深度学习研究课程(2018)
全球人工智能
4+阅读 · 2018年1月14日
Financial Time Series Representation Learning
Arxiv
10+阅读 · 2020年3月27日
VIP会员
相关VIP内容
不可错过!CMU《深度学习导论》2020课程,附课件与视频
专知会员服务
80+阅读 · 2020年10月27日
【CMU】最新深度学习课程, Introduction to Deep Learning
专知会员服务
37+阅读 · 2020年9月12日
最新《统计机器学习》课程,26页ppt
专知会员服务
82+阅读 · 2020年8月30日
【视频】几何数据嵌入表示学习,74页ppt
专知会员服务
34+阅读 · 2020年7月24日
Python导论,476页pdf,现代Python计算
专知会员服务
261+阅读 · 2020年5月17日
Yann Lecun 纽约大学《深度学习(PyTorch)》课程(2020)PPT
专知会员服务
181+阅读 · 2020年3月16日
【课程】概率图模型,卡内基梅隆大学邢波
专知会员服务
70+阅读 · 2019年11月4日
【CMU】机器学习导论课程(Introduction to Machine Learning)
专知会员服务
60+阅读 · 2019年8月26日
微信扫码咨询专知VIP会员