微软研究院Jianfeng Gao:基于深度学习的自然语言处理导论(课程,附PPT下载链接)

2018 年 1 月 24 日 专知 专知内容组(编)

【导读】深度学习近几年在各领域的发展可谓是如火如荼,基于深度学习的自然语言处理方法也大受关注。本文介绍微软研究院Jianfeng Gao的一个暑期课程,课程主要讲解如何用深度学习做自然语言处理。课程主要分为四章:深度学习和自然语言处理(NLP)的介绍、用于文本处理的深度语义相似模型(DSSM)、用深度学习做机器阅读理解(MRC)和问答(QA)、基于深度学习的对话研究。相信通过学习该课程,你会对自然语言处理最新的方法有更深的理解,同时也希望能对您的科研或工作带来帮助。


An Introduction to Deep Learning for Natural Language Processing

Jianfeng Gao Microsoft Research 

基于深度学习的自然语言处理导论


概要




在这个演讲中,我将简要介绍深度学习的历史及其在自然语言处理(NLP)任务中的应用。 然后我详细描述了最近为三个NLP任务领域开发的深度学习技术方法。 首先是一系列深度学习模型,用于对文本和图像之间的语义相似性进行建模,该任务是网络搜索排名,推荐,图像描述生成和机器翻译等应用的基础。 其次是开发一套模型,解决机器阅读理解和自动问答相关问题。 第三个是将深度学习应用在各种对话工具上,包括面向具体任务的聊天机器人(比如智能客服)和社交型的通用聊天机器人(Siri, 小冰)。


课程大纲



 

  • 第一章:深度学习和自然语言处理(NLP)引言



  • 深度学习简史


  • 用神经网络进行query分类


  • NLP任务中深度学习模型概述

 

  • 第二章:使用深度语义相似模型(DSSM)进行文本处理



  • 建模语义相似性的挑战


  • 什么是DSSM


  • 基于DSSM的Web搜索排名应用


  • 基于DSSM的推荐应用


  • 基于DSSM的自动图像描述生成和其他任务。

 

  • 第三章:用深度学习做机器阅读理解(MRC)和问答(QA)——MRC和QA的挑战



  • 对符号方法的简要回顾


  • 从符号到神经的方法


  • 最先进的MRC模型


  • 面向开放域(open-domain)的QA系统

 

  • 第四章:基于深度学习的对话



  • 开发开放领域聊天机器人的挑战


  • 使用深度强化学习来开发面向具体任务的聊天机器人


  • 基于神经对话引擎的社交型的通用聊天机器人


参考



 

第一章: Yih, He & Gao. Deep learning and continuous representations for natural language processing. Tutorial presented in HLT-NAACL-2015, IJCAI-2016.

第二章 (DSSM): We have developed a series of deep semantic similarity models (DSSM, also a.k.a. Sent2Vec), which have been used for many text and image processing tasks, including web search [Huang et al. 2013Shen et al. 2014], recommendation [Gao et al. 2014a], machine translation [Gao et al. 2014b], and QA [Yih et al. 2015].


第三章 (MRC): We released a new MRC dataset, called MS MARCO; and have developed a series of reasoning networks for MRC, aka ReasoNet and ReasoNet with shared memory.


第四章 (Dialogue): We have developed neural network models for social bots trained on Twitter data [project site] and task-completion bots [Lipton et al. 2016;Bhuwan et al. 2016] trained via deep reinforcement learning using a user simulator.

 

作者简介:



 

Jianfeng Gao Microsoft Research

Jianfeng Gao is Partner Research Manager in Deep Learning Technology Center (DLTC) at Microsoft Research, Redmond. He works on deep learning for text and image processing and leads the development of AI systems for dialogue, machine reading comprehension (MRC), question answering (QA), and enterprise applications. From 2006 to 2014, he was Principal Researcher at Natural Language Processing Group at Microsoft Research, Redmond, where he worked on Web search, query understanding and reformulation, ads prediction, and statistical machine translation. From 2005 to 2006, he was a research lead in Natural Interactive Services Division at Microsoft, where he worked on Project X, an effort of developing natural user interface for Windows. From 1999 to 2005, he was Research Lead in Natural Language Computing Group at Microsoft Research Asia. He, together with his colleagues, developed the first Chinese speech recognition system released with Microsoft Office, the Chinese/Japanese Input Method Editors (IME) which were the leading products in the market, and the natural language platform for Windows Vista.


参考链接:

http://grammars.grlmc.com/DeepLearn2017/coursedescription/

https://www.microsoft.com/en-us/research/people/jfgao/

https://www.microsoft.com/en-us/research/publication/introduction-deep-learning-natural-language-processing-tutorial-deeplearning2017-summer-school-bilbao-2/#


请关注专知公众号(扫一扫最下面专知二维码,或者点击上方蓝色专知),

  • 后台回复“MSRANLP” 就可以获取 课程全部PPT下载链接~


PPT




PPT详细内容如下:


-END-

专 · 知

人工智能领域主题知识资料查看获取【专知荟萃】人工智能领域26个主题知识资料全集(入门/进阶/论文/综述/视频/专家等)

请PC登录www.zhuanzhi.ai或者点击阅读原文,注册登录专知,获取更多AI知识资料

请扫一扫如下二维码关注我们的公众号,获取人工智能的专业知识!

请加专知小助手微信(Rancho_Fang),加入专知主题人工智能群交流!

点击“阅读原文”,使用专知

登录查看更多
17

相关内容

高剑锋,微软合伙人,微软Redmond总部人工智能部门的研究经理。他致力于深度学习在文本和图像处理方面的研发,领导机器阅读理解、问答、对话方面的研究和人工智能系统开发,以及微软新一代商务人工智能系统的研发。2000到2005年期间,他是微软亚洲研究院的自然语言计算部门的科研带头人,和同事合作开发了微软Office中的第一个中文语音识别系统,作为市场主导产品的中日文输入法编辑器(IME)和微软 Windows自然语言平台。
深度学习自然语言处理概述,216页ppt,Jindřich Helcl
专知会员服务
212+阅读 · 2020年4月26日
【新书】深度学习搜索,Deep Learning for Search,附327页pdf
专知会员服务
204+阅读 · 2020年1月13日
【课程】浙大陈华钧教授《知识图谱导论》课程系列PPT
专知会员服务
170+阅读 · 2019年10月29日
深度学习自然语言处理综述,266篇参考文献
专知会员服务
229+阅读 · 2019年10月12日
【LinkedIn报告】深度自然语言处理的搜索系统,211页pdf
专知会员服务
106+阅读 · 2019年6月21日
麻省理工2019年深度学习导论课程全套PPT
专知
14+阅读 · 2019年2月15日
免费自然语言处理(NLP)课程及教材分享
深度学习与NLP
29+阅读 · 2019年1月18日
福利 | 实践入门NLP:基于深度学习的自然语言处理
AI科技评论
9+阅读 · 2018年1月23日
实践入门NLP:基于深度学习的自然语言处理
AI研习社
10+阅读 · 2018年1月22日
Tutorial on NLP-Inspired Network Embedding
Arxiv
7+阅读 · 2019年10月16日
Neural Approaches to Conversational AI
Arxiv
8+阅读 · 2018年12月13日
Arxiv
53+阅读 · 2018年12月11日
Meta-Transfer Learning for Few-Shot Learning
Arxiv
8+阅读 · 2018年12月6日
Arxiv
22+阅读 · 2018年8月30日
Arxiv
11+阅读 · 2018年7月31日
Arxiv
10+阅读 · 2018年3月22日
Arxiv
13+阅读 · 2018年1月20日
VIP会员
相关论文
Tutorial on NLP-Inspired Network Embedding
Arxiv
7+阅读 · 2019年10月16日
Neural Approaches to Conversational AI
Arxiv
8+阅读 · 2018年12月13日
Arxiv
53+阅读 · 2018年12月11日
Meta-Transfer Learning for Few-Shot Learning
Arxiv
8+阅读 · 2018年12月6日
Arxiv
22+阅读 · 2018年8月30日
Arxiv
11+阅读 · 2018年7月31日
Arxiv
10+阅读 · 2018年3月22日
Arxiv
13+阅读 · 2018年1月20日
Top
微信扫码咨询专知VIP会员