前言:到目前为止已经讲了两种算法,但是都是一些数学公式等,学习起来也是感觉有趣的非常有趣,今天给大家带来一篇直观的用图解释A2C算法,废话不多说,上干货.
更多的数学原理和代码实现会陆续更新,敬请期待!
翻译参考地址: https://www.jqr.com/news/009604
原文地址(原文阅读须翻墙):https://medium.com/rudygilman/intuitive-rl-intro-to-advantage-actor-critic-a2c-4ff545978752