Horizon：Facebook的应用强化学习平台(PyTorch/Caffe2)- 专知

会员服务 ·

0

Horizon：Facebook的应用强化学习平台(PyTorch/Caffe2)

【导读】近期，Facebook开源了强化学习平台Horizon，Horizon是用Python构建的，使用PyTorch进行建模和训练，使用Caffe2进行模型服务。

Horizon是一个端到端平台，旨在解决行业应用的RL问题。强化学习在其数据集很大（数百万到数十亿），反馈环路很慢（相对于模拟器）时，必须小心地进行实验，因为它们不在模拟器中运行。与其他通常用于快速原型设计和实验的RL平台不同，Horizon的设计以生产用例为首要考虑因素。该平台包含用于训练流行的深度RL算法的工作流程，包括数据预处理，特征转换，分布式训练，反事实策略评估和优化服务。

支持的算法：

Discrete-Action DQN
Parametric-Action DQ
Double DQN, Dueling DQN, Dueling Double DQN
DDPG
[Soft Actor-Critic]
(https://arxiv.org/abs/1801.01290) (SAC)

Github地址：

https://github.com/facebookresearch/Horizon

论文地址：

https://research.fb.com/publications/horizon-facebooks-open-source-applied-reinforcement-learning-platform/

-END-

专 · 知

人工智能领域26个主题知识资料全集获取与加入专知人工智能服务群: 欢迎微信扫一扫加入专知人工智能知识星球群，获取专业知识教程视频资料和与专家交流咨询！

请PC登录www.zhuanzhi.ai或者点击阅读原文，注册登录专知，获取更多AI知识资料！

请加专知小助手微信（扫一扫如下二维码添加），加入专知主题群（请备注主题类型：AI、NLP、CV、 KG等）交流~

AI 项目技术 & 商务合作：bd@zhuanzhi.ai, 或扫描上面二维码联系！

请关注专知公众号，获取人工智能的专业知识！

点击“阅读原文”，使用专知

展开全文

相关主题

专知—深度学习：算法到实战

专知主题导航

微信扫码咨询专知VIP会员