【Facebook-Yuandong Tian】在RL中为搜索和探索找到良好的表示，附71页PPT与视频

2021 年 4 月 16 日 专知

如何学习良好的潜在表示是现代机器学习时代的一个重要课题。对于强化学习，使用一个好的表示使决策过程更加有效。本次演讲，我将介绍我们的工作，构建基于任务的潜在操作空间，用于基于搜索的黑盒函数优化，寻找策略变更的表示，该表示支持在不完全信息协同博弈中联合策略搜索，以及不同的表示如何影响RL探索。

视频：

https://www.youtube.com/watch?v=sH4a2a0ntUA

Yuandong Tian is a Research Scientist and Manager in Facebook AI Research, working on deep reinforcement learning, representation learning and optimization. He is the lead scientist and engineer for ELF OpenGo and DarkForest Go projects. Prior to that, he was in Google Self-driving Car team in 2013-2014. He received a Ph.D in Robotics Institute, Carnegie Mellon University in 2013. He is the recipient of 2013 ICCV Marr Prize Honorable Mentions.

专知便捷查看

便捷下载，请关注专知公众号（点击上方蓝色专知关注）

后台回复“RL71” 就可以获取《【Facebook-Yuandong Tian】在RL中为搜索和探索找到良好的表示，附71页PPT与视频》专知下载链接

专知，专业可信的人工智能知识分发 ，让认知协作更快更好！欢迎注册登录专知www.zhuanzhi.ai，获取5000+AI主题干货知识资料！

欢迎微信扫一扫加入专知人工智能知识星球群，获取最新AI专业干货知识教程资料和与专家交流咨询！

点击“ 阅读原文 ”，了解使用专知 ，查看获取5000+AI主题知识资源

登录查看更多

相关内容

Facebook

关注 29

Facebook 是一个社交网络服务网站，于 2004 年 2 月 4 日上线。从 2006 年 9 月到 2007 年 9 月间，该网站在全美网站中的排名由第 60 名上升至第 7 名。同时 Facebook 是美国排名第一的照片分享站点。 2012年 2 月 1 日，Facebook向美国证券交易委员会提交集资规模为 50 亿美元的上市申请。

深度学习优化算法，73页ppt，Optimization Algorithms on Deep Learning

专知会员服务

135+阅读 · 2021年6月16日

强化学习如何用于信息检索？请看ECIR2021《基于强化学习的信息检索》教程，附175页ppt与视频

专知会员服务

33+阅读 · 2021年4月1日

「元学习」最新AAAI2021-Tutorial，附视频与240页ppt

专知会员服务

117+阅读 · 2021年2月7日

LinkedIn《贝叶斯优化推荐系统》，IJCAI报告，142页ppt

专知会员服务

52+阅读 · 2021年1月11日