写了一篇关于多模态学习综述的综述！ - 专知

会员服务 ·

0

写了一篇关于多模态学习综述的综述！

2022 年 8 月 17 日 PaperWeekly

什么是多模态？

多模态指的是多种模态的信息，包括：文本、图像、视频、音频等。

它像人类利用视觉、嗅觉、味觉、听觉等多感官理解现实世界一样，希望充分利用文本、图像、语音和视频等多种模态，这就是「多模态学习」。多模态学习的研究时间不算太长，但应用前景非常广泛，如淘宝搜图、AI字幕、AI虚拟数字人、仿人交互、智能助手、商品推荐和信息流广告、视频帧人脸帧的图向量检索、语音交互等等。

不过, 要说多模态技术真正实现了落地，似乎还太早，从多模态数据标注到跨模态转化，该领域都面临着众多挑战。这就需要研究社区和业界持续探索新的发展方向和技术范式。

我们很荣幸邀请到了在人工智能、计算机视觉领域有着丰富的一线实战经验的唐宇迪博士，利用2天的时间，为大家系统地梳理多模态技术。

直播内容

01

PART

直播时间：8月17日-8月18日，20:00-22:30

Day1：深度学习CNN卷积神经网络算法精讲

神经网络模型知识点分析

神经网络模型整体架构解读

卷积神经网络整体架构及参数设计

Day2：对比学习与多模态任务解读

深度学习中对比学习的思想与应用方法
OpenAI 多模态任务CLIP算法解读
CLIP应用实例与效果分析
多模态任务在各领域的应用实例分析

对多模态技术感兴趣的同学，扫下方二维码，预约直播。

原价199

扫描下方二维码

0.02元报名 !

福利较大，限前100名

02

PART

主讲老师

直播收获

0 3

PART

开放全部代码，课后复用方便高效

对于课程中涉及到的全部代码，我们将免费开放！

你可以用于课后自查、复习巩固，甚至复用于日后的业务，方便高效！

讲师带练，伴随式编程环境

你将获得伴随式的编程环境。

讲师带练、运用科学的方法引导，帮你消化疑难知识点

同时还有@唐宇迪老师将会分享 , 一线热门技术和行业经验，众多学员亲测有效的一套技术提升方案，帮你摆脱迷茫，明确成长方向！

三位一体跟踪服务，项目实战驱动 , 深刻理解原理

只要报名，就能收获讲师、助教、班班全程三位一体跟踪式服务，24H为你答疑解惑。

同时还有来自五湖四海的大牛做同学，技术氛围浓厚，想不进步都难！

完课礼包

注意：已整理到网盘 , 添加助理 , 报名课程后免费领取！

🔥🔥🔥

☑ 名师助力 ☑ 含金量高 ☑ 提升专业能力

粉丝优惠！ 0.02元 !

福利较大，限前100名

Q&A

Q：课程内容具体有什么？

A：包括但不限于：基于多模态预训练模型的应用及研究进展分析+名师1V1答疑+专业提升技巧

Q：上课方式是什么？

A：扫码添加老师微信，领取课程链接!

登录查看更多

1

相关内容

「多模态处理技术」最新2022研究进展综述

「多模态处理技术」最新2022研究进展综述

专知会员服务

137+阅读 · 2022年10月29日

多模态预训练到哪了？微信最新《视觉语言预训练:基础、最新进展和未来趋势》，102页阐述VLP进展

多模态预训练到哪了？微信最新《视觉语言预训练:基础、最新进展和未来趋势》，102页阐述VLP进展

专知会员服务

48+阅读 · 2022年10月18日

视觉语言多模态预训练综述

视觉语言多模态预训练综述

专知会员服务

122+阅读 · 2022年7月11日

多模态情绪识别研究综述

多模态情绪识别研究综述

专知会员服务

170+阅读 · 2020年12月21日

多模态学习方法综述

专知会员服务

235+阅读 · 2020年5月6日

神经网络，凉了？

神经网络，凉了？

图与推荐

1+阅读 · 2022年9月13日

强的离谱，Transformer杀疯了！

强的离谱，Transformer杀疯了！

PaperWeekly

0+阅读 · 2022年8月23日

综述 | 基于深度学习的目标检测算法

综述 | 基于深度学习的目标检测算法

夕小瑶的卖萌屋

2+阅读 · 2022年4月19日

缺陷检测的传统算法与深度学习算法

缺陷检测的传统算法与深度学习算法

CVer

1+阅读 · 2022年4月13日

强的离谱，Transformer 杀疯了！

强的离谱，Transformer 杀疯了！

夕小瑶的卖萌屋

0+阅读 · 2022年3月9日

基于深度学习的音乐特征学习与分类

国家自然科学基金

7+阅读 · 2014年12月31日

基于上下文感知的日常远程监测高血压智能分析及预警技术研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于结构约束的多模态学习理论和方法

国家自然科学基金

6+阅读 · 2014年12月31日

基于多光谱视频的目标跟踪技术研究

国家自然科学基金

1+阅读 · 2012年12月31日

基于视频的城市交通场景理解与建模方法研究

国家自然科学基金

0+阅读 · 2012年12月31日

Robust-MSA: Understanding the Impact of Modality Noise on Multimodal Sentiment Analysis

Arxiv

0+阅读 · 2022年11月24日

Diffusion Models in Vision: A Survey

Arxiv

30+阅读 · 2022年9月10日

Multimodal Learning with Transformers: A Survey

Arxiv

69+阅读 · 2022年6月13日

A Survey of Transformers

Arxiv

103+阅读 · 2021年6月8日

Notes on Deep Learning for NLP

Arxiv

22+阅读 · 2018年8月30日

VIP会员

相关主题

多模态学习

相关VIP内容

「多模态处理技术」最新2022研究进展综述

「多模态处理技术」最新2022研究进展综述

专知会员服务

137+阅读 · 2022年10月29日

多模态预训练到哪了？微信最新《视觉语言预训练:基础、最新进展和未来趋势》，102页阐述VLP进展

多模态预训练到哪了？微信最新《视觉语言预训练:基础、最新进展和未来趋势》，102页阐述VLP进展

专知会员服务

48+阅读 · 2022年10月18日

视觉语言多模态预训练综述

视觉语言多模态预训练综述

专知会员服务

122+阅读 · 2022年7月11日

多模态情绪识别研究综述

多模态情绪识别研究综述

专知会员服务

170+阅读 · 2020年12月21日

多模态学习方法综述

专知会员服务

235+阅读 · 2020年5月6日

热门VIP内容

开通专知VIP会员享更多权益服务

大模型推理时代的知识编辑

《利用人工智能对军事行动进行建模》

【MIT博士论文】加速科学发现的因果建模实践算法

机器人、无人机与实时影像：应对城市爆炸威胁的三大技术方案

相关资讯

神经网络，凉了？

神经网络，凉了？

图与推荐

1+阅读 · 2022年9月13日

强的离谱，Transformer杀疯了！

强的离谱，Transformer杀疯了！

PaperWeekly

0+阅读 · 2022年8月23日

综述 | 基于深度学习的目标检测算法

综述 | 基于深度学习的目标检测算法

夕小瑶的卖萌屋

2+阅读 · 2022年4月19日

缺陷检测的传统算法与深度学习算法

缺陷检测的传统算法与深度学习算法

CVer

1+阅读 · 2022年4月13日

强的离谱，Transformer 杀疯了！

强的离谱，Transformer 杀疯了！

夕小瑶的卖萌屋

0+阅读 · 2022年3月9日

相关基金

基于深度学习的音乐特征学习与分类

国家自然科学基金

7+阅读 · 2014年12月31日

基于上下文感知的日常远程监测高血压智能分析及预警技术研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于结构约束的多模态学习理论和方法

国家自然科学基金

6+阅读 · 2014年12月31日

基于多光谱视频的目标跟踪技术研究

国家自然科学基金

1+阅读 · 2012年12月31日

基于视频的城市交通场景理解与建模方法研究

国家自然科学基金

0+阅读 · 2012年12月31日

相关论文

Robust-MSA: Understanding the Impact of Modality Noise on Multimodal Sentiment Analysis

Arxiv

0+阅读 · 2022年11月24日

Diffusion Models in Vision: A Survey

Arxiv

30+阅读 · 2022年9月10日

Multimodal Learning with Transformers: A Survey

Arxiv

69+阅读 · 2022年6月13日

A Survey of Transformers

Arxiv

103+阅读 · 2021年6月8日

Notes on Deep Learning for NLP

Arxiv

22+阅读 · 2018年8月30日

大家都在搜

蓝牙安全攻防

大型语言模型

朱克爱德华兹家族

冷启动，0预算，如何借助分销裂变引爆私域用户增长？

微信扫码咨询专知VIP会员