聊聊大火的多模态

会员服务 ·

聊聊大火的多模态

2022 年 7 月 25 日 夕小瑶的卖萌屋

多模态机器学习，英文全称 MultiModal Machine Learning (MMML)，旨在通过机器学习的方法实现处理和理解多源模态信息的能力。

每一种信息的来源或者形式，都可以称为一种模态。例如，人有触觉，听觉，视觉，嗅觉；信息有语音、视频、文字等媒介；多种多样的传感器，如雷达、红外、加速度计等。以上的每一种都可以称为一种模态。

模态也可以有非常广泛的定义，比如我们可以把两种不同的语言当做是两种模态，甚至在两种不同情况下采集到的数据集，亦可认为是两种模态。

当下，多模态技术有着相当广泛的应用场景，如淘宝搜图、AI字幕、AI虚拟数字人、仿人交互、智能助手、商品推荐和信息流广告、视频帧人脸帧的图向量检索、语音交互等等。

我们很荣幸邀请到了拥有多项专利和多年大厂算法工程师工作经验的Peng老师，利用2小时左右的时间，为大家系统地梳理多模态技术。

直播分享内容

PART

Day1直播

01 多模态的发展与未来

02 论文泛读：CLIP— 多模态领域鸿蒙之钟巨作

03 学习路径推荐

Day2直播

论文精读—CLIP：多模态领域鸿蒙之钟巨作
01 Research background
02 Introduction
03 Model
04 实验
05 结论

PART

主讲老师

直播时间

PART

7月28日（周四）晚20:00-21:00

7月29日（周五）晚20:00-21:00

对多模态技术感兴趣的同学，扫下方二维码，预约直播。

扫码支付0.1元即预约成功

直播当晚会有工作人员联系你~

PART

多模态学习路径

01 多模态理论基础

学习多模态预训练相关论文——CLIP、ALIGN、VILT

02 自监督算法

学习一些多模态预训练可能用到的自监督方案——MAE、DINO、MOCO

03 多模态下游任务介绍

主要了解VQA任务和nlvr任务

04 多模态应用

Image Captioning案例、阿里电商跨模态检索案例。了解任务介绍、baseline搭建、模型优化、结果展示。

05 多模态项目

AI智能文案、基于多模态预训练模型的手机相册管理与检索、AI唇语识别、基于深度多模态目标检测和语义分割的自动驾驶

对多模态技术感兴趣的同学，扫下方二维码，预约直播。

扫码支付0.1元即预约成功

直播当晚会有工作人员联系你~

登录查看更多

相关内容

多模

关注 2

多模态认知计算

专知会员服务

181+阅读 · 2022年9月16日

【CVPR 2022】【视频检索用多模态融合Transformer】Everything at Once -- Multi-modal Fusion Transformer for Video Retrieval

专知会员服务

29+阅读 · 2022年3月6日

【ACL2021】基于跨模态对比学习的统一模态理解与生成方法

专知会员服务

29+阅读 · 2021年8月5日

多模态预训练模型简述

专知会员服务

113+阅读 · 2021年4月27日

千亿参数！阿里清华联合推理史上最大中文多模态预训练器M6！

专知会员服务

42+阅读 · 2021年3月3日

多模态模型发展趋势总结

机器学习与推荐算法

6+阅读 · 2022年4月14日

NLP领域最近比较火的Prompt，能否借鉴到多模态领域？一文跟进最新进展

PaperWeekly

17+阅读 · 2022年3月8日

用多模态信息做 prompt，解锁 GPT 新玩法

夕小瑶的卖萌屋

1+阅读 · 2021年10月18日

多模态为什么比单模态好？第一份严谨证明来了！

夕小瑶的卖萌屋

1+阅读 · 2021年8月2日

多模态大模型——通用人工智能路径的探索

中国科学院自动化研究所

2+阅读 · 2021年7月9日

无人驾驶车辆智能测试评估与环境设计

国家自然科学基金

28+阅读 · 2014年12月31日

二氧化钛外延单晶薄膜的制备及其特性研究

国家自然科学基金

0+阅读 · 2014年12月31日

社交媒体多模态品牌追踪与事件检测

国家自然科学基金

7+阅读 · 2014年12月31日

视觉角驾驶行为模型研究

国家自然科学基金

0+阅读 · 2012年12月31日

多模态混合流体仿真的关键技术研究

国家自然科学基金

1+阅读 · 2011年12月31日

Unifying Vision-and-Language Tasks via Text Generation

Arxiv

10+阅读 · 2021年2月4日

Embedding-based Retrieval in Facebook Search

Arxiv

12+阅读 · 2020年6月20日

Billion-scale Commodity Embedding for E-commerce Recommendation in Alibaba

Arxiv

15+阅读 · 2018年5月24日

Attention-based Group Recommendation

Arxiv

14+阅读 · 2018年4月18日

Deep Reinforcement Learning for List-wise Recommendations

Arxiv

13+阅读 · 2018年1月5日

VIP会员