【斯坦福-NLP-seminar】知识密集强化学习，72页ppt，Facebook TIM - 专知VIP

会员服务 ·

0

强化学习 ·

2021 年 4 月 27 日

【斯坦福-NLP-seminar】知识密集强化学习，72页ppt，Facebook TIM

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

强化学习(RL)方法的进展与挑战环境的发展密切相关，这些环境测试了当前方法的极限。虽然现有的RL环境要么足够复杂，要么基于快速模拟，但它们很少同时具备这两点。此外，RL的研究主要集中在可以接近白板的环境上，也就是说，不需要将任何领域或世界知识转移到模拟环境之外的代理。我将谈论《NetHack学习环境》(NLE)，这是一个可扩展的、程序生成的、随机的、丰富的和具有挑战性的研究环境，基于流行的单人终端游戏《NetHack》。我们认为，《NetHack》足够复杂，能够推动对探索、规划、技能习得和语言条件下的RL等问题的长期研究，同时大大减少收集大量经验所需的计算资源。有趣的是，这款游戏甚至对人类玩家来说都是极具挑战性的，因为人类玩家通常需要多年时间才能第一次解决这一问题，他们通常会求助于外部自然语言知识资源，如《NetHack Wiki》，以提高自己的技能。在演讲的最后，我还将介绍我们最近在大规模文本知识源的条件作用方面的工作，以及这些技术如何为将来在更复杂、更真实的环境中实现高效的样本RL铺平道路。

https://nlp.stanford.edu/seminar/details/timrocktaschel.shtml

成为VIP会员查看完整内容

29

相关内容

【斯坦福NLP-CS224N硬核课】自然语言处理未来与深度学习，81页ppt

【斯坦福NLP-CS224N硬核课】自然语言处理未来与深度学习，81页ppt

专知会员服务

61+阅读 · 2021年3月15日

【斯坦福CS224N硬核课】问答系统，陈丹琦讲解，79页ppt

【斯坦福CS224N硬核课】问答系统，陈丹琦讲解，79页ppt

专知会员服务

74+阅读 · 2021年2月23日

【MILA-唐建】学习知识图谱推理的符号逻辑规则，附视频与PPT

【MILA-唐建】学习知识图谱推理的符号逻辑规则，附视频与PPT

专知会员服务

85+阅读 · 2021年2月13日

TextCNN大牛Kim《深度无监督学习句法结构分析》，88页ppt

TextCNN大牛Kim《深度无监督学习句法结构分析》，88页ppt

专知会员服务

29+阅读 · 2021年1月13日

【斯坦福】分布式算法与优化，118页pdf

专知会员服务

82+阅读 · 2020年12月22日

最新《自监督表示学习》报告，70页ppt

最新《自监督表示学习》报告，70页ppt

专知会员服务

86+阅读 · 2020年12月22日

少即是多？非参数语言模型，68页ppt

少即是多？非参数语言模型，68页ppt

专知会员服务

24+阅读 · 2020年11月22日

【ICML2020】强化学习中基于模型的方法，279页ppt

【ICML2020】强化学习中基于模型的方法，279页ppt

专知会员服务

48+阅读 · 2020年10月26日

【CMU-Google-斯坦福】可控行为的弱监督强化学习，Weakly-Supervised RL

【CMU-Google-斯坦福】可控行为的弱监督强化学习，Weakly-Supervised RL

专知会员服务

22+阅读 · 2020年4月8日

【新书】Python强化学习-基于Tensorflow与Keras和OpenAI Gym实战, 177页pdf

【新书】Python强化学习-基于Tensorflow与Keras和OpenAI Gym实战, 177页pdf

专知会员服务

185+阅读 · 2020年1月17日

NAACL 2019自然语言处理亮点

NAACL 2019自然语言处理亮点

专知

15+阅读 · 2019年6月15日

【干货】NLP中的迁移学习教程来啦！（238页PPT下载）

【干货】NLP中的迁移学习教程来啦！（238页PPT下载）

新智元

35+阅读 · 2019年6月3日

斯坦福NLP组最新报告：自然语言处理中的学习挑战（附149页报告全文下载）

斯坦福NLP组最新报告：自然语言处理中的学习挑战（附149页报告全文下载）

专知

14+阅读 · 2019年4月8日

OpenAI发布Neural MMO ：大型多智能体游戏环境

OpenAI发布Neural MMO ：大型多智能体游戏环境

大数据文摘

6+阅读 · 2019年3月5日

前沿知识特惠团《OpenAI强化学习实战》

前沿知识特惠团《OpenAI强化学习实战》

炼数成金订阅号

3+阅读 · 2018年12月4日

深度学习贝叶斯，这是一份密集的6天速成课程（附视频与PPT）

深度学习贝叶斯，这是一份密集的6天速成课程（附视频与PPT）

数据派THU

17+阅读 · 2018年9月23日

微软研究院开源项目TextWorld：可用于强化学习训练的文本游戏

微软研究院开源项目TextWorld：可用于强化学习训练的文本游戏

专知

5+阅读 · 2018年8月11日

OpenAI 发布完整版游戏强化学习研究平台 Gym Retro

OpenAI 发布完整版游戏强化学习研究平台 Gym Retro

AI研习社

6+阅读 · 2018年5月28日

OpenAI强化学习实战

OpenAI强化学习实战

炼数成金订阅号

9+阅读 · 2018年5月14日

【学界】伯克利吴翼&FAIR田渊栋等人提出强化学习环境Hourse3D

【学界】伯克利吴翼&FAIR田渊栋等人提出强化学习环境Hourse3D

GAN生成式对抗网络

5+阅读 · 2018年1月13日

Residual Reinforcement Learning from Demonstrations

Arxiv

0+阅读 · 2021年6月15日

Multilingual Neural Semantic Parsing for Low-Resourced Languages

Multilingual Neural Semantic Parsing for Low-Resourced Languages

Arxiv

0+阅读 · 2021年6月14日

Span-based Semantic Parsing for Compositional Generalization

Arxiv

0+阅读 · 2021年6月13日

From Paraphrasing to Semantic Parsing: Unsupervised Semantic Parsing via Synchronous Semantic Decoding

Arxiv

0+阅读 · 2021年6月11日

Span Pointer Networks for Non-Autoregressive Task-Oriented Semantic Parsing

Arxiv

0+阅读 · 2021年4月16日

Cross-Modality Attention with Semantic Graph Embedding for Multi-Label Classification

Cross-Modality Attention with Semantic Graph Embedding for Multi-Label Classification

Arxiv

3+阅读 · 2019年12月17日

A Sketch-Based System for Semantic Parsing

A Sketch-Based System for Semantic Parsing

Arxiv

4+阅读 · 2019年9月12日

Symbolic Priors for RNN-based Semantic Parsing

Symbolic Priors for RNN-based Semantic Parsing

Arxiv

3+阅读 · 2018年9月20日

Improving Information Extraction from Images with Learned Semantic Models

Improving Information Extraction from Images with Learned Semantic Models

Arxiv

6+阅读 · 2018年8月27日

Virtual-to-Real: Learning to Control in Visual Semantic Segmentation

Arxiv

4+阅读 · 2018年4月29日

VIP会员

相关主题

相关VIP内容

【斯坦福NLP-CS224N硬核课】自然语言处理未来与深度学习，81页ppt

【斯坦福NLP-CS224N硬核课】自然语言处理未来与深度学习，81页ppt

专知会员服务

61+阅读 · 2021年3月15日

【斯坦福CS224N硬核课】问答系统，陈丹琦讲解，79页ppt

【斯坦福CS224N硬核课】问答系统，陈丹琦讲解，79页ppt

专知会员服务

74+阅读 · 2021年2月23日

【MILA-唐建】学习知识图谱推理的符号逻辑规则，附视频与PPT

【MILA-唐建】学习知识图谱推理的符号逻辑规则，附视频与PPT

专知会员服务

85+阅读 · 2021年2月13日

TextCNN大牛Kim《深度无监督学习句法结构分析》，88页ppt

TextCNN大牛Kim《深度无监督学习句法结构分析》，88页ppt

专知会员服务

29+阅读 · 2021年1月13日

【斯坦福】分布式算法与优化，118页pdf

专知会员服务

82+阅读 · 2020年12月22日

最新《自监督表示学习》报告，70页ppt

最新《自监督表示学习》报告，70页ppt

专知会员服务

86+阅读 · 2020年12月22日

少即是多？非参数语言模型，68页ppt

少即是多？非参数语言模型，68页ppt

专知会员服务

24+阅读 · 2020年11月22日

【ICML2020】强化学习中基于模型的方法，279页ppt

【ICML2020】强化学习中基于模型的方法，279页ppt

专知会员服务

48+阅读 · 2020年10月26日

【CMU-Google-斯坦福】可控行为的弱监督强化学习，Weakly-Supervised RL

【CMU-Google-斯坦福】可控行为的弱监督强化学习，Weakly-Supervised RL

专知会员服务

22+阅读 · 2020年4月8日

【新书】Python强化学习-基于Tensorflow与Keras和OpenAI Gym实战, 177页pdf

【新书】Python强化学习-基于Tensorflow与Keras和OpenAI Gym实战, 177页pdf

专知会员服务

185+阅读 · 2020年1月17日

热门VIP内容

开通专知VIP会员享更多权益服务

大语言模型时代的文档智能：综述

蜂窝通信是否是无人机与无人地面战车主宰战场的关键？

文档视觉问答简述

最新新Agent综述！76页327篇论文梳理，北交大桑基韬教授团队发布《迈向模型原生智能体式人工智能的范式转变综述》

相关资讯

NAACL 2019自然语言处理亮点

NAACL 2019自然语言处理亮点

专知

15+阅读 · 2019年6月15日

【干货】NLP中的迁移学习教程来啦！（238页PPT下载）

【干货】NLP中的迁移学习教程来啦！（238页PPT下载）

新智元

35+阅读 · 2019年6月3日

斯坦福NLP组最新报告：自然语言处理中的学习挑战（附149页报告全文下载）

斯坦福NLP组最新报告：自然语言处理中的学习挑战（附149页报告全文下载）

专知

14+阅读 · 2019年4月8日

OpenAI发布Neural MMO ：大型多智能体游戏环境

OpenAI发布Neural MMO ：大型多智能体游戏环境

大数据文摘

6+阅读 · 2019年3月5日

前沿知识特惠团《OpenAI强化学习实战》

前沿知识特惠团《OpenAI强化学习实战》

炼数成金订阅号

3+阅读 · 2018年12月4日

深度学习贝叶斯，这是一份密集的6天速成课程（附视频与PPT）

深度学习贝叶斯，这是一份密集的6天速成课程（附视频与PPT）

数据派THU

17+阅读 · 2018年9月23日

微软研究院开源项目TextWorld：可用于强化学习训练的文本游戏

微软研究院开源项目TextWorld：可用于强化学习训练的文本游戏

专知

5+阅读 · 2018年8月11日

OpenAI 发布完整版游戏强化学习研究平台 Gym Retro

OpenAI 发布完整版游戏强化学习研究平台 Gym Retro

AI研习社

6+阅读 · 2018年5月28日

OpenAI强化学习实战

OpenAI强化学习实战

炼数成金订阅号

9+阅读 · 2018年5月14日

【学界】伯克利吴翼&FAIR田渊栋等人提出强化学习环境Hourse3D

【学界】伯克利吴翼&FAIR田渊栋等人提出强化学习环境Hourse3D

GAN生成式对抗网络

5+阅读 · 2018年1月13日

相关论文

Residual Reinforcement Learning from Demonstrations

Arxiv

0+阅读 · 2021年6月15日

Multilingual Neural Semantic Parsing for Low-Resourced Languages

Multilingual Neural Semantic Parsing for Low-Resourced Languages

Arxiv

0+阅读 · 2021年6月14日

Span-based Semantic Parsing for Compositional Generalization

Arxiv

0+阅读 · 2021年6月13日

From Paraphrasing to Semantic Parsing: Unsupervised Semantic Parsing via Synchronous Semantic Decoding

Arxiv

0+阅读 · 2021年6月11日

Span Pointer Networks for Non-Autoregressive Task-Oriented Semantic Parsing

Arxiv

0+阅读 · 2021年4月16日

Cross-Modality Attention with Semantic Graph Embedding for Multi-Label Classification

Cross-Modality Attention with Semantic Graph Embedding for Multi-Label Classification

Arxiv

3+阅读 · 2019年12月17日

A Sketch-Based System for Semantic Parsing

A Sketch-Based System for Semantic Parsing

Arxiv

4+阅读 · 2019年9月12日

Symbolic Priors for RNN-based Semantic Parsing

Symbolic Priors for RNN-based Semantic Parsing

Arxiv

3+阅读 · 2018年9月20日

Improving Information Extraction from Images with Learned Semantic Models

Improving Information Extraction from Images with Learned Semantic Models

Arxiv

6+阅读 · 2018年8月27日

Virtual-to-Real: Learning to Control in Visual Semantic Segmentation

Arxiv

4+阅读 · 2018年4月29日

微信扫码咨询专知VIP会员