VALSE 短教程 第03期:视觉与语言智能

2021 年 9 月 18 日 VALSE

为了帮助视觉与学习领域相关从业者快速、透彻地了解某个前沿方向或技术领域,VALSE最新推出了《VALSE短教程》栏目。该栏目将逐渐邀请若干研究方向的资深专家,系统深入地讲解某个研究方向,录制讲课视频,并上传VALSE B站

 (https://space.bilibili.com/562085182/),供大家随时查看和学习。


本期短教程我们选取的研究领域是《视觉与语言智能》,并非常荣幸地邀请到了粤港澳大湾区数字经济研究院张磊首席研究员及微软研究院张鹏川高级研究员作为讲师。


观看网址:

https://www.bilibili.com/video/BV1Af4y1n7zx/


短教程讲师:张磊 (粤港澳大湾区数字经济研究院)


讲师简介:

张磊是粤港澳大湾区数字经济研究院(IDEA)的讲席科学家,负责计算机视觉与机器人研究方向。他自2001年起曾在微软亚洲研究院、微软总部研究院及计算机视觉相关产品部门任首席研究员,长期带领研究组从事计算机视觉方向的基础研究以及在大规模图像分析、物体检测、视觉语言多模态理解方面的应用,研究成果被广泛用于微软必应搜索及认知服务云计算平台。他在计算机视觉等相关领域发表论文150多篇,并拥有60多项美国授权专利。因其对大规模图像识别和多媒体信息检索方面做出的贡献,他于2020年获选为IEEE Fellow。



短教程讲师:张鹏川 (微软研究院)


讲师简介:

张鹏川是微软研究院雷德蒙德实验室的高级研究员。2012年毕业于清华大学基础科学实验班,获得理学学士学位。2017 年毕业于美国加州理工学院,获得计算与数学科学博士学位,后加入微软研究院从事机器学习研究。 他的研究兴趣主要集中在深度学习、数学优化及其在视觉语言智能中的应用领域。 在理论方面,他致力于为机器学习开发更自动化、更快的训练算法。 在应用方面,他致力于视觉语言(VL)多模态智能的研究,包括视觉语言预训练和各种下游的视觉和多模态任务。他的工作已在顶级机器学习会议(CPVR, ICCV, ECCV, NeurIPS, ICLR, ICML 等)上发表,并出现在多家媒体(Wired、TechCrunch、GeekWire 等)上,并已被应用到多个微软的产品(Azure 认知服务、Bing 多媒体搜索等)中。



短教程摘要:

视觉语言理解是计算机视觉和自然语言理解的交叉研究领域,主要研究多模态的表示学习和各种多模态任务。本教程分为三个讲座:第一个讲座讲解一些早期(2010 - 2018)比较重要的视觉语言理解的工作;第二个讲座重点介绍视觉语言预训练(2019 – 现在);第三个讲座介绍最近的几个更大规模的视觉语言预训练的工作,以及这个领域的发展趋势。



请扫码或点击阅读原文观看视频


看到这了,确定不关注下吗?关注下再走吧~


特别鸣谢本次Tutorial主要组织者:

主办AC:苏航 (清华大学)


活动参与方式

1、VALSE每周举行的Webinar活动依托B站直播平台进行,直播地址:https://live.bilibili.com/22300737;VALSE的近期历史视频可在这里观看:https://space.bilibili.com/562085182/ 


2、VALSE Webinar活动通常每周三晚上20:00进行,但偶尔会因为讲者时区问题略有调整,为方便您参加活动,请关注VALSE微信公众号:valse_wechat 或加入VALSE QQ R群,群号:137634472);


*注:申请加入VALSE QQ群时需验证姓名、单位和身份,缺一不可。入群后,请实名,姓名身份单位。身份:学校及科研单位人员T;企业研发I;博士D;硕士M。


3. VALSE微信公众号一般会在每周四发布下一周Webinar报告的通知。


4、您也可以通过访问VALSE主页:http://valser.org/ 直接查看Webinar活动信息。Webinar报告的PPT(经讲者允许后),会在VALSE官网每期报告通知的最下方更新。

登录查看更多
0

相关内容

VALSE 发起于 2011年,是 Vision And Learning Seminar 的简写,取“华尔兹舞”之意。目的是为全球计算机视觉、模式识别、机器学习、多媒体技术等相关领域的华人青年学者提供一个平等、自由的学术交流舞台。官网:http://valser.org/
中科院自动化所徐波团队最新《视觉-语言预训练》综述
专知会员服务
66+阅读 · 2022年2月23日
常识知识的获取与推理,171页ppt
专知会员服务
61+阅读 · 2021年11月9日
【Tutorial】计算机视觉中的Transformer,98页ppt
专知会员服务
144+阅读 · 2021年10月25日
最新《域自适应视觉应用》ECCV2020教程,67页PPT
专知会员服务
26+阅读 · 2020年12月24日
最新《域自适应视觉应用》ECCV2020教程,43页PPT
专知会员服务
25+阅读 · 2020年11月5日
从HPO到NAS: 自动深度学习
专知会员服务
37+阅读 · 2020年6月15日
首个视觉-语言预训练综述来了!
夕小瑶的卖萌屋
8+阅读 · 2022年3月29日
中科院自动化所:最新视觉-语言预训练综述
PaperWeekly
3+阅读 · 2022年3月1日
VALSE Webinar 19-16期 云深可知处:视觉SLAM
VALSE
12+阅读 · 2019年7月4日
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
3+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
1+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
Transformers in Medical Image Analysis: A Review
Arxiv
39+阅读 · 2022年2月24日
Arxiv
20+阅读 · 2021年2月28日
Arxiv
17+阅读 · 2021年1月21日
Arxiv
35+阅读 · 2019年11月7日
VIP会员
相关基金
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
3+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
1+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
Top
微信扫码咨询专知VIP会员