【导读】近年来,强化学习特别是深度强化学习在棋类、视屏游戏、机器人控制等问题上取得了极大的成功,成为人工智能研究的热点。 微软亚洲研究院的秦涛研究员在报告《强化学习简介》中对强化学习做一个简要介绍。
报告内容
该报告分为3个部分:
强化学习基础,包括:
马氏决策过程
Bellman方程
规划
最优控制
蒙特卡洛采样
TD算法
强化学习新算法,包括:
基于值函数的算法
基于策略函数的算法
基于两者的混合算法
强化学习所面临的挑战,如鲁棒性、样本效率等
讲者简介
秦涛 博士,微软亚洲研究院资深研究员/经理,中国科学技术大学博士生导师。主要研究领域包括机器学习和人工智能(深度学习和强化学习的算法设计、理论分析及在实际问题中的应用),互联网搜索与计算广告,博弈论和多智能体系统,在国际会议和期刊上发表学术论文100余篇。曾任SIGIR、ACML、AAMAS领域主席,担任多个国际学术大会程序委员会成员,包括ICML、NIPS、KDD、IJCAI、AAAI、WSDM、EC、SIGIR、AAMAS、WINE,曾任多个国际学术研讨会联合主席。获得《北京青年》2017年度年度“工匠精神·青年榜样”奖。
请关注专知公众号(扫一扫最下面专知二维码,或者点击上方蓝色专知)
后台回复“MSRLT4” 就可以获取PDF下载链接~
附部分PPT:
参考链接:
http://www.cips-cl.org/static/CCL2018/downloads/tutorialsPPT/T4.pdf
-END-
专 · 知
人工智能领域26个主题知识资料全集获取与加入专知人工智能服务群: 欢迎微信扫一扫加入专知人工智能知识星球群,获取专业知识教程视频资料和与专家交流咨询!
请PC登录www.zhuanzhi.ai或者点击阅读原文,注册登录专知,获取更多AI知识资料!
请加专知小助手微信(扫一扫如下二维码添加),加入专知主题群(请备注主题类型:AI、NLP、CV、 KG等)交流~
请关注专知公众号,获取人工智能的专业知识!
点击“阅读原文”,使用专知