直播 | 明晚八点！清华AAAI录用论文——强化学习在自然语言处理经典问题上的初探 - 专知

会员服务 ·

0

直播 | 明晚八点！清华AAAI录用论文——强化学习在自然语言处理经典问题上的初探

2017 年 11 月 28 日 AI科技评论 连接学术产业的

分享背景

▼

随着强化学习在机器人和游戏AI等领域的成功，该方法也引起了越来越多的关注。本次分享将介绍我们利用强化学习技术，更好地解决自然语言处理中的两个经典任务：关系抽取和文本分类。在关系抽取任务中，我们尝试利用强化学习，解决远程监督方法自动生成的训练数据中的噪音问题。在文本分类任务中，我们利用强化学习得到更好的句子的结构化表示，并利用该表示得到了更好的文本分类效果。这两个工作均发表于AAAI 2018。

分享主题

▼

强化学习在自然语言处理经典问题上的初探

分享提纲

▼

1、强化学习基本概念简要介绍

2、基于强化学习的关系抽取方法，解决远程监督方法自动生成的训练数据中的噪音问题

3、基于强化学习的句子结构化表示学习方法

分享人简介

▼

冯珺，清华大学计算机系博士五年级，师从朱小燕和黄民烈教授，主要研究方向为知识图谱，强化学习。目前已在AAAI，COLING, WSDM等国际会议上发表多篇文章。

分享时间

▼

北京时间2017年11月29日（周三） 20:00

参与方式

▼

扫描海报二维码关注微信公众号，点击AI课程——公开课报名，入群交流

————— AI 科技评论招人啦！ —————

我们诚招学术编辑 N 枚（全职，坐标北京）、新媒体运营 N 枚（全职，坐标深圳）。

详情请参见：招聘 | AI科技评论招人啦，学术编辑、新媒体运营虚位以待！

欢迎发送简历到 guoyixin@leiphone.com

————— 给爱学习的你的福利 —————

不要等到算法出现accuracy不好、loss很高、模型overfitting时，

才后悔没有掌握基础数学理论！

线性代数及矩阵论，概率论与统计，凸优化

AI慕课学院机器学习之数学基础课程即将上线！

扫码进入课程咨询群，组队享团购优惠！

详细了解点击文末阅读原文

————————————————————

登录查看更多

7

相关内容

强化学习

强化学习（RL）是机器学习的一个领域，与软件代理应如何在环境中采取行动以最大化累积奖励的概念有关。除了监督学习和非监督学习外，强化学习是三种基本的机器学习范式之一。强化学习与监督学习的不同之处在于，不需要呈现带标签的输入/输出对，也不需要显式纠正次优动作。相反，重点是在探索（未知领域）和利用（当前知识）之间找到平衡。该环境通常以马尔可夫决策过程（MDP）的形式陈述，因为针对这种情况的许多强化学习算法都使用动态编程技术。经典动态规划方法和强化学习算法之间的主要区别在于，后者不假设MDP的确切数学模型，并且针对无法采用精确方法的大型MDP。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等

深度学习自然语言处理概述，216页ppt，Jindřich Helcl

深度学习自然语言处理概述，216页ppt，Jindřich Helcl

专知会员服务

216+阅读 · 2020年4月26日

【EMNLP2019教程】图神经网络GNN的自然语言处理，附315页PPT及作者博士论文下载

【EMNLP2019教程】图神经网络GNN的自然语言处理，附315页PPT及作者博士论文下载

专知会员服务

78+阅读 · 2020年1月27日

【CCL 2019】句法分析前沿动态综述，上海科技大学屠可伟博士

【CCL 2019】句法分析前沿动态综述，上海科技大学屠可伟博士

专知会员服务

26+阅读 · 2019年11月12日

【CCL 2019】ATT-第19期：生成对抗网络（邱锡鹏）

【CCL 2019】ATT-第19期：生成对抗网络（邱锡鹏）

专知会员服务

50+阅读 · 2019年11月12日

机器学习经典—理论与算法 [王立威北京大学] 2019年中国计算机大会计算机经典算法回顾与展望——机器学习与数据挖掘论坛

机器学习经典—理论与算法 [王立威北京大学] 2019年中国计算机大会计算机经典算法回顾与展望——机器学习与数据挖掘论坛

专知会员服务

36+阅读 · 2019年10月26日

干货 | AAAI 2018 论文预讲：当强化学习遇见自然语言处理有哪些奇妙的化学反应？

干货 | AAAI 2018 论文预讲：当强化学习遇见自然语言处理有哪些奇妙的化学反应？

AI科技评论

7+阅读 · 2018年1月10日

直播 | 明晚八点！听浙大博士生刘汉唐介绍图像分割的经典算法

直播 | 明晚八点！听浙大博士生刘汉唐介绍图像分割的经典算法

AI科技评论

8+阅读 · 2018年1月8日

直播 | 今晚八点！听清华博士孙奕帆介绍行人再识别论文及最新相关进展

直播 | 今晚八点！听清华博士孙奕帆介绍行人再识别论文及最新相关进展

AI科技评论

4+阅读 · 2017年12月21日

清华大学冯珺：基于强化学习的关系抽取和文本分类 | 实录·PhD Talk

清华大学冯珺：基于强化学习的关系抽取和文本分类 | 实录·PhD Talk

PaperWeekly

11+阅读 · 2017年11月23日

今晚8点：基于强化学习的关系抽取和文本分类 | PhD Talk #18

今晚8点：基于强化学习的关系抽取和文本分类 | PhD Talk #18

PaperWeekly

4+阅读 · 2017年11月22日

AliCoCo: Alibaba E-commerce Cognitive Concept Net

AliCoCo: Alibaba E-commerce Cognitive Concept Net

Arxiv

13+阅读 · 2020年3月30日

What Can Neural Networks Reason About?

Arxiv

10+阅读 · 2020年2月15日

Fast deep reinforcement learning using online adjustments from the past

Arxiv

3+阅读 · 2018年10月18日

A Gauss-Newton Approach to Real-Time Monocular Multiple Object Tracking

A Gauss-Newton Approach to Real-Time Monocular Multiple Object Tracking

Arxiv

4+阅读 · 2018年7月5日

Experience-driven Networking: A Deep Reinforcement Learning based Approach

Arxiv

9+阅读 · 2018年1月17日

VIP会员

相关主题

自然语言处理

相关VIP内容

深度学习自然语言处理概述，216页ppt，Jindřich Helcl

深度学习自然语言处理概述，216页ppt，Jindřich Helcl

专知会员服务

216+阅读 · 2020年4月26日

【EMNLP2019教程】图神经网络GNN的自然语言处理，附315页PPT及作者博士论文下载

【EMNLP2019教程】图神经网络GNN的自然语言处理，附315页PPT及作者博士论文下载

专知会员服务

78+阅读 · 2020年1月27日

【CCL 2019】句法分析前沿动态综述，上海科技大学屠可伟博士

【CCL 2019】句法分析前沿动态综述，上海科技大学屠可伟博士

专知会员服务

26+阅读 · 2019年11月12日

【CCL 2019】ATT-第19期：生成对抗网络（邱锡鹏）

【CCL 2019】ATT-第19期：生成对抗网络（邱锡鹏）

专知会员服务

50+阅读 · 2019年11月12日

机器学习经典—理论与算法 [王立威北京大学] 2019年中国计算机大会计算机经典算法回顾与展望——机器学习与数据挖掘论坛

机器学习经典—理论与算法 [王立威北京大学] 2019年中国计算机大会计算机经典算法回顾与展望——机器学习与数据挖掘论坛

专知会员服务

36+阅读 · 2019年10月26日

热门VIP内容

开通专知VIP会员享更多权益服务

大模型推理时代的知识编辑

《利用人工智能对军事行动进行建模》

【MIT博士论文】加速科学发现的因果建模实践算法

机器人、无人机与实时影像：应对城市爆炸威胁的三大技术方案

相关资讯

干货 | AAAI 2018 论文预讲：当强化学习遇见自然语言处理有哪些奇妙的化学反应？

干货 | AAAI 2018 论文预讲：当强化学习遇见自然语言处理有哪些奇妙的化学反应？

AI科技评论

7+阅读 · 2018年1月10日

直播 | 明晚八点！听浙大博士生刘汉唐介绍图像分割的经典算法

直播 | 明晚八点！听浙大博士生刘汉唐介绍图像分割的经典算法

AI科技评论

8+阅读 · 2018年1月8日

直播 | 今晚八点！听清华博士孙奕帆介绍行人再识别论文及最新相关进展

直播 | 今晚八点！听清华博士孙奕帆介绍行人再识别论文及最新相关进展

AI科技评论

4+阅读 · 2017年12月21日

清华大学冯珺：基于强化学习的关系抽取和文本分类 | 实录·PhD Talk

清华大学冯珺：基于强化学习的关系抽取和文本分类 | 实录·PhD Talk

PaperWeekly

11+阅读 · 2017年11月23日

今晚8点：基于强化学习的关系抽取和文本分类 | PhD Talk #18

今晚8点：基于强化学习的关系抽取和文本分类 | PhD Talk #18

PaperWeekly

4+阅读 · 2017年11月22日

相关论文

AliCoCo: Alibaba E-commerce Cognitive Concept Net

AliCoCo: Alibaba E-commerce Cognitive Concept Net

Arxiv

13+阅读 · 2020年3月30日

What Can Neural Networks Reason About?

Arxiv

10+阅读 · 2020年2月15日

Fast deep reinforcement learning using online adjustments from the past

Arxiv

3+阅读 · 2018年10月18日

A Gauss-Newton Approach to Real-Time Monocular Multiple Object Tracking

A Gauss-Newton Approach to Real-Time Monocular Multiple Object Tracking

Arxiv

4+阅读 · 2018年7月5日

Experience-driven Networking: A Deep Reinforcement Learning based Approach

Arxiv

9+阅读 · 2018年1月17日

大家都在搜

大型语言模型

蓝牙安全攻防

朱克爱德华兹家族

滴滴司机调度系统实践

微信扫码咨询专知VIP会员