【斯坦福-NLP-seminar】知识密集强化学习,72页ppt,Facebook TIM

2021 年 4 月 27 日 专知

强化学习(RL)方法的进展与挑战环境的发展密切相关,这些环境测试了当前方法的极限。虽然现有的RL环境要么足够复杂,要么基于快速模拟,但它们很少同时具备这两点。此外,RL的研究主要集中在可以接近白板的环境上,也就是说,不需要将任何领域或世界知识转移到模拟环境之外的代理。我将谈论《NetHack学习环境》(NLE),这是一个可扩展的、程序生成的、随机的、丰富的和具有挑战性的研究环境,基于流行的单人终端游戏《NetHack》。我们认为,《NetHack》足够复杂,能够推动对探索、规划、技能习得和语言条件下的RL等问题的长期研究,同时大大减少收集大量经验所需的计算资源。有趣的是,这款游戏甚至对人类玩家来说都是极具挑战性的,因为人类玩家通常需要多年时间才能第一次解决这一问题,他们通常会求助于外部自然语言知识资源,如《NetHack Wiki》,以提高自己的技能。在演讲的最后,我还将介绍我们最近在大规模文本知识源的条件作用方面的工作,以及这些技术如何为将来在更复杂、更真实的环境中实现高效的样本RL铺平道路。

https://nlp.stanford.edu/seminar/details/timrocktaschel.shtml


专知便捷查看

便捷下载,请关注专知公众号(点击上方蓝色专知关注)

  • 后台回复“KRL” 就可以获取【斯坦福-NLP-seminar】知识密集强化学习,72页ppt,Facebook TIM》专知下载链接

专知,专业可信的人工智能知识分发 ,让认知协作更快更好!欢迎注册登录专知www.zhuanzhi.ai,获取5000+AI主题干货知识资料!


欢迎微信扫一扫加入专知人工智能知识星球群,获取最新AI专业干货知识教程资料和与专家交流咨询
点击“ 阅读原文 ”,了解使用 专知 ,查看获取5000+AI主题知识资源
登录查看更多
0

相关内容

强化学习(RL)是机器学习的一个领域,与软件代理应如何在环境中采取行动以最大化累积奖励的概念有关。除了监督学习和非监督学习外,强化学习是三种基本的机器学习范式之一。 强化学习与监督学习的不同之处在于,不需要呈现带标签的输入/输出对,也不需要显式纠正次优动作。相反,重点是在探索(未知领域)和利用(当前知识)之间找到平衡。 该环境通常以马尔可夫决策过程(MDP)的形式陈述,因为针对这种情况的许多强化学习算法都使用动态编程技术。经典动态规划方法和强化学习算法之间的主要区别在于,后者不假设MDP的确切数学模型,并且针对无法采用精确方法的大型MDP。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等
【斯坦福CS224N硬核课】 问答系统,陈丹琦讲解,79页ppt
专知会员服务
72+阅读 · 2021年2月23日
「元学习」最新AAAI2021-Tutorial,附视频与240页ppt
专知会员服务
114+阅读 · 2021年2月7日
【Google】梯度下降,48页ppt
专知会员服务
79+阅读 · 2020年12月5日
【ICML2020】强化学习中基于模型的方法,279页ppt
专知会员服务
43+阅读 · 2020年10月26日
【DeepMind】强化学习教程,83页ppt
专知会员服务
147+阅读 · 2020年8月7日
深度强化学习策略梯度教程,53页ppt
专知会员服务
176+阅读 · 2020年2月1日
【斯坦福新课】CS234:强化学习,附课程PPT下载
专知会员服务
114+阅读 · 2020年1月15日
【斯坦福&Google】面向机器人的机器学习,63页PPT
专知会员服务
23+阅读 · 2019年11月19日
自然语言处理(NLP)前沿进展报告(PPT下载)
Arxiv
7+阅读 · 2020年10月7日
Arxiv
12+阅读 · 2020年6月20日
Arxiv
5+阅读 · 2020年3月17日
VIP会员
相关VIP内容
【斯坦福CS224N硬核课】 问答系统,陈丹琦讲解,79页ppt
专知会员服务
72+阅读 · 2021年2月23日
「元学习」最新AAAI2021-Tutorial,附视频与240页ppt
专知会员服务
114+阅读 · 2021年2月7日
【Google】梯度下降,48页ppt
专知会员服务
79+阅读 · 2020年12月5日
【ICML2020】强化学习中基于模型的方法,279页ppt
专知会员服务
43+阅读 · 2020年10月26日
【DeepMind】强化学习教程,83页ppt
专知会员服务
147+阅读 · 2020年8月7日
深度强化学习策略梯度教程,53页ppt
专知会员服务
176+阅读 · 2020年2月1日
【斯坦福新课】CS234:强化学习,附课程PPT下载
专知会员服务
114+阅读 · 2020年1月15日
【斯坦福&Google】面向机器人的机器学习,63页PPT
专知会员服务
23+阅读 · 2019年11月19日
Top
微信扫码咨询专知VIP会员