在 Hugging Face,我们正在为深度强化学习的研究人员和爱好者的生态系统做出贡献。最近,我们集成了Deep RL框架,比如Stable-Baselines3。
今天,我们很高兴地宣布,我们将Decision Transformer(一种离线强化学习方法)集成到🤗Transformer库和拥抱面部中心中。我们有一些令人兴奋的计划来提高Deep RL领域的可访问性,我们期待着在未来的几周和几个月与您分享。
什么是离线强化学习? 引入 决策 Transformers 使用🤗Transformer中的Decision Transformer 结论 接下来是什么? 参考文献