【干货】93页随机近似与强化学习教程分享(附PDF下载)

【导读】随着Alpha Go的成功,强化学习始终是人们谈论的焦点。本文为大家编译了来自佛罗里达大学的Adithya M. Devraj分享的随机近似与强化学习教程,希望对大家的理论学习有所帮助。


介绍:


随机近似算法通常用来逼近固定点方程的解,其中涉及了函数未知分布的期望。该领域中,目前最着名的例子是TD和Q-Learning算法。


本次教程将从以下几个部分进行讲解:

  • 随机近似

  • 最快的随机近似方法

  • 随机动量优化

  • 强化学习

  • Zap Q-learning

  • 结论以及未来的工作


请关注专知公众号(扫一扫最下面专知二维码,或者点击上方蓝色专知)

  • 后台回复“SARL” 就可以获取全文报告PDF下载链接~ 


附PDF全文:



-END-

专 · 知

人工智能领域26个主题知识资料全集获取与加入专知人工智能服务群: 欢迎微信扫一扫加入专知人工智能知识星球群,获取专业知识教程视频资料和与专家交流咨询!


请PC登录www.zhuanzhi.ai或者点击阅读原文,注册登录专知,获取更多AI知识资料!



请加专知小助手微信(扫一扫如下二维码添加),加入专知主题群(请备注主题类型:AI、NLP、CV、 KG等)交流~

 AI 项目技术 & 商务合作:bd@zhuanzhi.ai, 或扫描上面二维码联系!

请关注专知公众号,获取人工智能的专业知识!

点击“阅读原文”,使用专知

展开全文
Top
微信扫码咨询专知VIP会员