【导读】随着Alpha Go的成功,强化学习始终是人们谈论的焦点。本文为大家编译了来自佛罗里达大学的Adithya M. Devraj分享的随机近似与强化学习教程,希望对大家的理论学习有所帮助。
介绍:
随机近似算法通常用来逼近固定点方程的解,其中涉及了函数未知分布的期望。该领域中,目前最着名的例子是TD和Q-Learning算法。
本次教程将从以下几个部分进行讲解:
随机近似
最快的随机近似方法
随机动量优化
强化学习
Zap Q-learning
结论以及未来的工作
请关注专知公众号(扫一扫最下面专知二维码,或者点击上方蓝色专知)
后台回复“SARL” 就可以获取全文报告PDF下载链接~
附PDF全文:
-END-
专 · 知
人工智能领域26个主题知识资料全集获取与加入专知人工智能服务群: 欢迎微信扫一扫加入专知人工智能知识星球群,获取专业知识教程视频资料和与专家交流咨询!
请PC登录www.zhuanzhi.ai或者点击阅读原文,注册登录专知,获取更多AI知识资料!
请加专知小助手微信(扫一扫如下二维码添加),加入专知主题群(请备注主题类型:AI、NLP、CV、 KG等)交流~
请关注专知公众号,获取人工智能的专业知识!
点击“阅读原文”,使用专知