【资源】Python强化学习实战,Anaconda公司的高级数据科学家讲解(附相关Python开源库)

2017 年 12 月 10 日 专知 专知内容组

点击上方“专知”关注获取专业AI知识!

【导读】Christine Doig是Anaconda公司的高级数据科学家。没错Anaconda就是那个著名的Python科学计算与发行管理软件。Christine Doig从最基本的强化学习概念开始介绍强化学习Python实践经验,并以强化学习中的经典任务--Cartpole问题作为学习的入门例子,讲解从环境搭建、模型训练再到最后的效果评估的结果。


简介




Cartpole描述的问题可以认为是:在一辆小车上竖立一根杆子,然后给小车一个推或者拉的力,使得杆子尽量保持平衡不滑倒。

更详细的描述可参见openai官网上关于Cartpole问题的解释:https://gym.openai.com/envs/CartPole-v0



强化学习用到的python库




  • OpenAI

    Gym: Toolkit for developing and comparing reinforcement learningalgorithms. MIT License, Last commit: November 2017

    baselines: high-quality implementations of reinforcement learning algorithms,MIT License, Last commit: November 2017


  • TensorForce, A TensorFlow library for applied reinforcement learning, Apache 2,Last commit: November 2017


  • DeepRL, Highly modularized implementation of popular deep RL algorithms byPyTorch, Apache 2 License, Last commit: November 2017


  • RLlab, a framework for developing and evaluating reinforcement learningalgorithms, MIT License, Last commit: July 2017


  • AgentNet, Python library for deep reinforcement learning usingTheano+Lasagne, MIT License, Last commit: August 2017


  • RLPy, the Reinforcement Learning Library for Education and Research,3-Clause BSD License, Last commit: April 2016.


  • PyBrain, the Python Machine Learning Library, 3-Clause BSD License, Lastcommit: March 2016.

强化学习资源




  • Reinforcement Learning courseby David Silver

    http://www0.cs.ucl.ac.uk/staff/d.silver/web/Teaching.html


  • https://blog.acolyer.org/2017/11/17/mastering-the-game-of-go-without-humanknowledge/


  • https://keon.io/deep-q-learning/


  • https://rishav1.github.io/reinlearning/2017/01/05/simple-swarm-intelligenceoptimization-for-cartpole-balancing-problem.html


  • AlphaGo Zero's win, what itmeans, Fast Forward Labs: http:// blog.fastforwardlabs.com/2017/10/25/alphago-zero.html


  • 更多可以查看专知以前推出的强化学习荟萃资料:

       【专知荟萃23】深度强化学习RL知识资料全集(入门/进阶/论文/综述/代码/专家,附查看)


PPT内容






参考链接:

https://speakerdeck.com/chdoig/rl-pytexas-2017


特别提示-Python强化学习实战 PPT下载

请关注专知公众号(扫一扫最下面专知二维码,或者点击上方蓝色专知),


  • 后台回复“RLP” 就可以获取PPT下载链接~


-END-

专 · 知

人工智能领域主题知识资料查看获取【专知荟萃】人工智能领域25个主题知识资料全集(入门/进阶/论文/综述/视频/专家等)

同时欢迎各位用户进行专知投稿,详情请点击

诚邀】专知诚挚邀请各位专业者加入AI创作者计划了解使用专知!

请PC登录www.zhuanzhi.ai或者点击阅读原文,注册登录专知,获取更多AI知识资料

请扫一扫如下二维码关注我们的公众号,获取人工智能的专业知识!

请加专知小助手微信(Rancho_Fang),加入专知主题人工智能群交流!

点击“阅读原文”,使用专知


登录查看更多
13

相关内容

强化学习(RL)是机器学习的一个领域,与软件代理应如何在环境中采取行动以最大化累积奖励的概念有关。除了监督学习和非监督学习外,强化学习是三种基本的机器学习范式之一。 强化学习与监督学习的不同之处在于,不需要呈现带标签的输入/输出对,也不需要显式纠正次优动作。相反,重点是在探索(未知领域)和利用(当前知识)之间找到平衡。 该环境通常以马尔可夫决策过程(MDP)的形式陈述,因为针对这种情况的许多强化学习算法都使用动态编程技术。经典动态规划方法和强化学习算法之间的主要区别在于,后者不假设MDP的确切数学模型,并且针对无法采用精确方法的大型MDP。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等
专知会员服务
171+阅读 · 2020年6月4日
【干货书】机器学习Python实战教程,366页pdf
专知会员服务
338+阅读 · 2020年3月17日
谷歌机器学习速成课程中文版pdf
专知会员服务
145+阅读 · 2019年12月4日
【新书】Python编程基础,669页pdf
专知会员服务
193+阅读 · 2019年10月10日
机器学习相关资源(框架、库、软件)大列表
专知会员服务
39+阅读 · 2019年10月9日
MIT新书《强化学习与最优控制》
专知会员服务
275+阅读 · 2019年10月9日
【电子书推荐】Data Science with Python and Dask
专知会员服务
43+阅读 · 2019年6月1日
(Python)3D人脸处理工具Face3d
AI研习社
7+阅读 · 2019年2月10日
资源 | 谷歌开源AdaNet:基于TensorFlow的AutoML框架
极市平台
4+阅读 · 2018年11月1日
OpenAI强化学习实战
炼数成金订阅号
9+阅读 · 2018年5月14日
最全数据科学学习资源:Python、线性代数、机器学习...
人工智能头条
11+阅读 · 2018年5月14日
Coursera上Python课程(公开课)汇总推荐
AINLP
8+阅读 · 2018年3月11日
Coursera上Python课程(公开课)汇总
数据挖掘入门与实战
6+阅读 · 2017年12月27日
送你一份深度学习资源&教程!
THU数据派
13+阅读 · 2017年11月30日
分布式TensorFlow入门指南
机器学习研究会
4+阅读 · 2017年11月28日
Do RNN and LSTM have Long Memory?
Arxiv
19+阅读 · 2020年6月10日
A Survey on Edge Intelligence
Arxiv
50+阅读 · 2020年3月26日
Arxiv
3+阅读 · 2019年9月5日
Arxiv
22+阅读 · 2018年8月30日
Arxiv
3+阅读 · 2018年3月13日
VIP会员
相关VIP内容
专知会员服务
171+阅读 · 2020年6月4日
【干货书】机器学习Python实战教程,366页pdf
专知会员服务
338+阅读 · 2020年3月17日
谷歌机器学习速成课程中文版pdf
专知会员服务
145+阅读 · 2019年12月4日
【新书】Python编程基础,669页pdf
专知会员服务
193+阅读 · 2019年10月10日
机器学习相关资源(框架、库、软件)大列表
专知会员服务
39+阅读 · 2019年10月9日
MIT新书《强化学习与最优控制》
专知会员服务
275+阅读 · 2019年10月9日
【电子书推荐】Data Science with Python and Dask
专知会员服务
43+阅读 · 2019年6月1日
相关资讯
(Python)3D人脸处理工具Face3d
AI研习社
7+阅读 · 2019年2月10日
资源 | 谷歌开源AdaNet:基于TensorFlow的AutoML框架
极市平台
4+阅读 · 2018年11月1日
OpenAI强化学习实战
炼数成金订阅号
9+阅读 · 2018年5月14日
最全数据科学学习资源:Python、线性代数、机器学习...
人工智能头条
11+阅读 · 2018年5月14日
Coursera上Python课程(公开课)汇总推荐
AINLP
8+阅读 · 2018年3月11日
Coursera上Python课程(公开课)汇总
数据挖掘入门与实战
6+阅读 · 2017年12月27日
送你一份深度学习资源&教程!
THU数据派
13+阅读 · 2017年11月30日
分布式TensorFlow入门指南
机器学习研究会
4+阅读 · 2017年11月28日
相关论文
Do RNN and LSTM have Long Memory?
Arxiv
19+阅读 · 2020年6月10日
A Survey on Edge Intelligence
Arxiv
50+阅读 · 2020年3月26日
Arxiv
3+阅读 · 2019年9月5日
Arxiv
22+阅读 · 2018年8月30日
Arxiv
3+阅读 · 2018年3月13日
Top
微信扫码咨询专知VIP会员