为了帮助视觉与学习领域相关从业者快速、透彻地了解某个前沿方向或技术领域,VALSE最新推出了《VALSE短教程》栏目。该栏目将逐渐邀请若干研究方向的资深专家,系统深入地讲解并录制某个研究方向的视频,并上传VALSE B站
(https://space.bilibili.com/562085182/),供大家随时查看和学习。
本期短教程我们选取的研究领域是《视觉语言导航》,并非常荣幸地邀请到了澳大利亚阿德莱德大学的吴琦副教授作为讲师。在该教程中,吴教授介绍了视觉语言导航领域的任务、数据和挑战,然后讲解了该领域的主流方法,欢迎大家观看学习。
短教程讲师:吴琦 (澳大利亚阿德莱德大学)
短教程题目:Vision and Language Navigation (视觉语言导航)
观看网址:
https://www.bilibili.com/video/BV13g41157yL/
讲师简介:
吴琦,澳大利亚阿德莱德大学高级讲师(副教授),博士生导师,澳大利亚青年学者基金获得者 (Australian Research Council DECRA Fellow),澳大利亚机器人视觉研究中心(ACRV)vision-language课题组组长,澳大利亚科学院罗素奖获得者。吴琦博士于2015年在英国巴斯大学获得博士学位,致力于计算机视觉领域研究,尤其关注于计算机视觉-自然语言相关领域的研究。吴琦博士在CVPR,ICCV,ECCV, AAAI, IJCAI, TPAMI等多个顶级国际会议和期刊发表论文七十余篇,吴琦博士亦担任TPAMI,IJCV,TIP,CVPR,NIPS,ACL等顶级学术期刊会议审稿人以及ICCV2021 领域主席。
短教程摘要:
视觉语言导航任务(Vision and Language Navigation) 是让智能体跟着自然语言指令进行导航,这个任务需要同时理解自然语言指令与视角中可以看见的图像信息,然后在环境中对自身所处状态做出对应的动作,最终达到目标位置。在本课程中,我们会介绍一些近期的视觉语言导航任务,数据和新的挑战,以及近期的主流方法,包括,如何融合视觉与导航指令信息,如何利用pre-training VLBERT去解决导航任务以及如何使用数据增广去解决视觉语言导航任务等。
看到这了,确定不关注下吗?关注下再走吧~
活动参与方式
1、VALSE每周举行的Webinar活动依托B站直播平台进行,直播地址:https://live.bilibili.com/22300737;VALSE的近期历史视频可在这里观看:https://space.bilibili.com/562085182/
2、VALSE Webinar活动通常每周三晚上20:00进行,但偶尔会因为讲者时区问题略有调整,为方便您参加活动,请关注VALSE微信公众号:valse_wechat 或加入VALSE QQ Q群,群号:698303207);
*注:申请加入VALSE QQ群时需验证姓名、单位和身份,缺一不可。入群后,请实名,姓名身份单位。身份:学校及科研单位人员T;企业研发I;博士D;硕士M。
3. VALSE微信公众号一般会在每周四发布下一周Webinar报告的通知。
4、您也可以通过访问VALSE主页:http://valser.org/ 直接查看Webinar活动信息。Webinar报告的PPT(经讲者允许后),会在VALSE官网每期报告通知的最下方更新。