深度强化学习实验室
框架的整体结构如下图所示:
训练程序的运行方式如下:
# start
python render_template . py foobar . yml . jinja2 | kubectl apply -f -
# stop
python render_template . py foobar . yml . jinja2 | kubectl delete -f -
同样,TLeague与IMPALA和SEED最相似,即也采用Actor-Learner-InferenceServer体系结构。也就是解耦RL组件与IMPALA和SEED最相似。下面是TLeague的工作流过程。
其中使用TLeague框架时需要的包环境
实现效果如下:
代码结构
安装依赖环境
'gym','joblib','numpy','scipy','pyzmq','paramiko','libtmux','abslpy','xlrd','pyyaml','psutil','namedlist',
安装过程
pip install -e .
代码测试执行过程:
论文链接:https://arxiv.org/abs/2011.12895v1
https://github.com/tencent-ailab/TLeague
完
总结3: 《强化学习导论》代码/习题答案大全
总结5: 万字总结 || 强化学习之路
总结9:分层强化学习(HRL)全面总结
完