公开课 | 强化学习及其在 NLP 上的应用

2018 年 6 月 14 日 AI研习社

分享背景

当AlphaGO横扫之后,越来越多的学者意识到强化学习在人工智能领域所扮演的重要角色。同时随着深度学习的发展,应用深度学习,很多自然语言的传统难题得到突破。另外,引用David Silver的一句话:深度学习(DL)+强化学习(RL) = 人工智能(AI)。今天,我将介绍的也就是深度学习和强化学习两大利器如何结合并应用于NLP中的文本生成和对话任务。

分享主题

强化学习及其在NLP上的应用

分享提纲

  • 强化学习与深度强化学习介绍。

  • 强化学习在文本生成的应用代表。

  • 强化学习在对话任务的应用代表。

分享嘉宾

叶志豪,就读于广东工业大学,主要研究方向为深度学习,强化学习,自然语言处理,对话及问答系统。

分享时间

(北京时间 ) 6 月 20 日(星期三)  20:00


GAIR 大会在即,

AI 研习社送福利了!


福利一

我们将会为高校学生提供若干张免费门票,只需填写「阅读原文」链接提交表单,就有机会获得价值 3999 元的CCF-GAIR 2018大会门票一张。

  福利二

我们将从提交的所有学生申请内,筛选 20 位国内顶尖优秀学术青年,承包国内往返机票+四晚住宿!更有机会与CCF-GAIR 2018与会嘉宾共进小型内部聚餐,给你一个与大牛面对面交流的机会!

(PS:请在表单内填写准确的微信号,审核通过后工作人员将通过微信与您取得联系,发放门票)

6 月 29 日至 7 月 1 日,深圳见!

赠票须知 

➤ 如无特别说明,赠送门票不包含餐饮,住宿等服务;

➤ 活动解释权归雷锋网 AI 研习社所有有

➤ 截止日期:6月26日晚24:00

登录查看更多
4

相关内容

强化学习(RL)是机器学习的一个领域,与软件代理应如何在环境中采取行动以最大化累积奖励的概念有关。除了监督学习和非监督学习外,强化学习是三种基本的机器学习范式之一。 强化学习与监督学习的不同之处在于,不需要呈现带标签的输入/输出对,也不需要显式纠正次优动作。相反,重点是在探索(未知领域)和利用(当前知识)之间找到平衡。 该环境通常以马尔可夫决策过程(MDP)的形式陈述,因为针对这种情况的许多强化学习算法都使用动态编程技术。经典动态规划方法和强化学习算法之间的主要区别在于,后者不假设MDP的确切数学模型,并且针对无法采用精确方法的大型MDP。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等
机器翻译深度学习最新综述
专知会员服务
98+阅读 · 2020年2月20日
专知会员服务
234+阅读 · 2020年1月23日
实践入门NLP:基于深度学习的自然语言处理
AI研习社
10+阅读 · 2018年1月22日
公开课 | 强化学习之基础入门
AI100
6+阅读 · 2018年1月7日
自然语言处理在人机对话中的应用
京东大数据
8+阅读 · 2017年8月11日
增强学习 分享ppt
机器学习读书会
7+阅读 · 2017年1月7日
Tutorial on NLP-Inspired Network Embedding
Arxiv
7+阅读 · 2019年10月16日
Arxiv
9+阅读 · 2019年4月19日
Arxiv
7+阅读 · 2018年12月26日
Arxiv
22+阅读 · 2018年8月30日
A Multi-Objective Deep Reinforcement Learning Framework
Arxiv
5+阅读 · 2018年6月5日
VIP会员
相关VIP内容
机器翻译深度学习最新综述
专知会员服务
98+阅读 · 2020年2月20日
专知会员服务
234+阅读 · 2020年1月23日
相关资讯
实践入门NLP:基于深度学习的自然语言处理
AI研习社
10+阅读 · 2018年1月22日
公开课 | 强化学习之基础入门
AI100
6+阅读 · 2018年1月7日
自然语言处理在人机对话中的应用
京东大数据
8+阅读 · 2017年8月11日
增强学习 分享ppt
机器学习读书会
7+阅读 · 2017年1月7日
相关论文
Tutorial on NLP-Inspired Network Embedding
Arxiv
7+阅读 · 2019年10月16日
Arxiv
9+阅读 · 2019年4月19日
Arxiv
7+阅读 · 2018年12月26日
Arxiv
22+阅读 · 2018年8月30日
A Multi-Objective Deep Reinforcement Learning Framework
Arxiv
5+阅读 · 2018年6月5日
Top
微信扫码咨询专知VIP会员