【CCL 2019】特邀报告，语言与视觉多模态智能的进展，京东AI研究院常务副院长何晓冬

报告主题： 语言与视觉多模态智能的进展

报告摘要： 基于近年来深度学习技术对语音，语言，视觉等子领域的推动，在语言和视觉跨模态交叉学科领域我们也取得了很多激动人心的进展，包括跨语言与图像的理解、推理和生成。具体而言，语言与视觉多模态智能的研究可分为多个层次，包括从底层的多模态表征学习，到上层的语言和视觉表征的融合与对应，再到更上层的应用比如图像描述、视觉问答、文字到图像合成等。同时各个层次的模型并不是万却独立，而往往是通过端到端的训练联合优化的。在报告中我将结合经典的语言与视觉多模态应用介绍跨语言和视觉的语义表示建模及跨模态信息融合。同时，我还将探讨多模态智能中的可解释性和可控性问题。最后，对多模态智能未来的突破进行了展望。

邀请嘉宾： 何晓冬博士是京东人工智能研究院常务副院长，深度学习及语音和语言实验室的负责人。他还在华盛顿大学(西雅图)、香港中文大学(深圳)、同济大学、及中央美术学院任兼职教授和荣誉教授。在加入京东集团之前，他曾担任微软雷德蒙德研究院深度学习技术中心的首席研究员和负责人。他的研究主要集中在人工智能领域，包括深度学习，自然语言处理，语音识别，计算机视觉，信息检索和多模态智能。他与合作者在这些领域发表了100多篇论文，谷歌学术统计引用数超过13000次，并多次获得优秀论文奖及赢得重要的人工智能方面大赛。他与合作者发明的深层结构化语义模型（DSSM/C-DSSM），分层注意力网络（HAN），CaptionBot，SAN，AttnGAN，BUTD Attention等广泛应用于语言，视觉，IR和人机对话等任务。基于其在自然语言和视觉技术及多模态信息处理方面的贡献，他于2018年入选IEEE Fellow。

成为VIP会员查看完整内容

01.pdf

相关内容

何晓冬

关注 3

何晓冬，京东集团技术副总裁，IEEE Fellow，京东人工智能研究员常务副院长，深度学习及语音和语言实验室的负责人，并担任华盛顿大学（西雅图）、香港中文大学（深圳）和同济大学兼职教授，及中央美术学院荣誉教授。曾在IEEE、ACM、ACL、AAAI等学会的期刊和学术会议担任编委、组委或领域主席，主要从事人工智能领域，包括深度学习、自然语言处理、语音识别、计算机视觉、信息检索和多模态智能等方面的研究。

【CAAI 2019】自然语言与理解，苏州大学| 周国栋教授

专知会员服务

63+阅读 · 2019年12月1日

【CCL 2019】信息抽取前沿动态，中科院自动化模式识别国家重点实验室助理研究员陈玉博博士

专知会员服务

85+阅读 · 2019年11月12日

【CCL 2019】多模态--基于视觉的跨模态文本生成，复旦大学副教授魏忠钰

专知会员服务

74+阅读 · 2019年11月12日

【多模态智能：表示学习、信息融合和应用】Multimodal Intelligence: Representation Learning, Information Fusion, and Applications，芝加哥大学计算机科学系博士zichao Yang、华盛顿大学西雅图分校副教授xiaodong He等

专知会员服务

118+阅读 · 2019年11月11日