在 Hugging Face,我们正在为深度强化学习的研究人员和爱好者的生态系统做出贡献。最近,我们集成了Deep RL框架,比如Stable-Baselines3。

今天,我们很高兴地宣布,我们将Decision Transformer(一种离线强化学习方法)集成到🤗Transformer库和拥抱面部中心中。我们有一些令人兴奋的计划来提高Deep RL领域的可访问性,我们期待着在未来的几周和几个月与您分享。

什么是离线强化学习? 引入 决策 Transformers 使用🤗Transformer中的Decision Transformer 结论 接下来是什么? 参考文献

成为VIP会员查看完整内容
66

相关内容

最新《Transformers模型》教程,64页ppt
专知会员服务
307+阅读 · 2020年11月26日
数据科学导论,54页ppt,Introduction to Data Science
专知会员服务
41+阅读 · 2020年7月27日
中科大《数据科学导论》课程
专知
6+阅读 · 2021年10月17日
为你推荐一份深度学习书单,来学习吧~
THU数据派
12+阅读 · 2018年3月13日
国家自然科学基金
1+阅读 · 2018年9月23日
国家自然科学基金
7+阅读 · 2017年12月31日
国家自然科学基金
5+阅读 · 2015年7月12日
国家自然科学基金
2+阅读 · 2015年5月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2008年12月31日
Risk and optimal policies in bandit experiments
Arxiv
0+阅读 · 2022年4月18日
Arxiv
19+阅读 · 2020年12月23日
VIP会员
相关VIP内容
相关基金
国家自然科学基金
1+阅读 · 2018年9月23日
国家自然科学基金
7+阅读 · 2017年12月31日
国家自然科学基金
5+阅读 · 2015年7月12日
国家自然科学基金
2+阅读 · 2015年5月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2008年12月31日
微信扫码咨询专知VIP会员