【资源】Python强化学习实战，Anaconda公司的高级数据科学家讲解（附相关Python开源库） - 专知

会员服务 ·

0

【资源】Python强化学习实战，Anaconda公司的高级数据科学家讲解（附相关Python开源库）

2017 年 12 月 10 日 专知专知内容组

点击上方“专知”关注获取专业AI知识!

【导读】Christine Doig是Anaconda公司的高级数据科学家。没错Anaconda就是那个著名的Python科学计算与发行管理软件。Christine Doig从最基本的强化学习概念开始介绍强化学习Python实践经验，并以强化学习中的经典任务--Cartpole问题作为学习的入门例子，讲解从环境搭建、模型训练再到最后的效果评估的结果。

▌简介

Cartpole描述的问题可以认为是：在一辆小车上竖立一根杆子，然后给小车一个推或者拉的力，使得杆子尽量保持平衡不滑倒。

更详细的描述可参见openai官网上关于Cartpole问题的解释：https://gym.openai.com/envs/CartPole-v0

▌强化学习用到的python库

OpenAI
Gym: Toolkit for developing and comparing reinforcement learningalgorithms. MIT License, Last commit: November 2017
baselines: high-quality implementations of reinforcement learning algorithms,MIT License, Last commit: November 2017
TensorForce, A TensorFlow library for applied reinforcement learning, Apache 2,Last commit: November 2017
DeepRL, Highly modularized implementation of popular deep RL algorithms byPyTorch, Apache 2 License, Last commit: November 2017
RLlab, a framework for developing and evaluating reinforcement learningalgorithms, MIT License, Last commit: July 2017
AgentNet, Python library for deep reinforcement learning usingTheano+Lasagne, MIT License, Last commit: August 2017
RLPy, the Reinforcement Learning Library for Education and Research,3-Clause BSD License, Last commit: April 2016.
PyBrain, the Python Machine Learning Library, 3-Clause BSD License, Lastcommit: March 2016.

▌强化学习资源

Reinforcement Learning courseby David Silver
http://www0.cs.ucl.ac.uk/staff/d.silver/web/Teaching.html
https://blog.acolyer.org/2017/11/17/mastering-the-game-of-go-without-humanknowledge/
https://keon.io/deep-q-learning/
https://rishav1.github.io/reinlearning/2017/01/05/simple-swarm-intelligenceoptimization-for-cartpole-balancing-problem.html
AlphaGo Zero's win, what itmeans, Fast Forward Labs: http:// blog.fastforwardlabs.com/2017/10/25/alphago-zero.html

更多可以查看专知以前推出的强化学习荟萃资料：

【专知荟萃23】深度强化学习RL知识资料全集（入门/进阶/论文/综述/代码/专家，附查看）

▌PPT内容

参考链接：

https://speakerdeck.com/chdoig/rl-pytexas-2017

▌特别提示-Python强化学习实战 PPT下载：

请关注专知公众号（扫一扫最下面专知二维码，或者点击上方蓝色专知），

后台回复“RLP” 就可以获取PPT下载链接~

-END-

专 · 知

人工智能领域主题知识资料查看获取：【专知荟萃】人工智能领域25个主题知识资料全集（入门/进阶/论文/综述/视频/专家等）

同时欢迎各位用户进行专知投稿，详情请点击：

【诚邀】专知诚挚邀请各位专业者加入AI创作者计划！了解使用专知！

请PC登录www.zhuanzhi.ai或者点击阅读原文，注册登录专知，获取更多AI知识资料！

请扫一扫如下二维码关注我们的公众号，获取人工智能的专业知识！

请加专知小助手微信（Rancho_Fang），加入专知主题人工智能群交流！

点击“阅读原文”，使用专知！

登录查看更多

13

相关内容

强化学习

强化学习（RL）是机器学习的一个领域，与软件代理应如何在环境中采取行动以最大化累积奖励的概念有关。除了监督学习和非监督学习外，强化学习是三种基本的机器学习范式之一。强化学习与监督学习的不同之处在于，不需要呈现带标签的输入/输出对，也不需要显式纠正次优动作。相反，重点是在探索（未知领域）和利用（当前知识）之间找到平衡。该环境通常以马尔可夫决策过程（MDP）的形式陈述，因为针对这种情况的许多强化学习算法都使用动态编程技术。经典动态规划方法和强化学习算法之间的主要区别在于，后者不假设MDP的确切数学模型，并且针对无法采用精确方法的大型MDP。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等

【干货书】Python机器学习导论，340页pdf数据科学家指南

专知会员服务

175+阅读 · 2020年6月4日

【干货书】用Python进行深思熟虑的机器学习, 216页pdf，Thoughtful ML with Python

【干货书】用Python进行深思熟虑的机器学习, 216页pdf，Thoughtful ML with Python

专知会员服务

70+阅读 · 2020年4月4日

【干货书】机器学习Python实战教程，366页pdf

【干货书】机器学习Python实战教程，366页pdf

专知会员服务

344+阅读 · 2020年3月17日

【新书】Python强化学习-基于Tensorflow与Keras和OpenAI Gym实战, 177页pdf

【新书】Python强化学习-基于Tensorflow与Keras和OpenAI Gym实战, 177页pdf

专知会员服务

184+阅读 · 2020年1月17日

谷歌机器学习速成课程中文版pdf

谷歌机器学习速成课程中文版pdf

专知会员服务

147+阅读 · 2019年12月4日

为机器学习应用实践Scikit-Learn，数据科学基础与Python，247页pdf

为机器学习应用实践Scikit-Learn，数据科学基础与Python，247页pdf

专知会员服务

143+阅读 · 2019年12月1日

【新书】Python编程基础，669页pdf

【新书】Python编程基础，669页pdf

专知会员服务

197+阅读 · 2019年10月10日

机器学习相关资源(框架、库、软件)大列表

机器学习相关资源(框架、库、软件)大列表

专知会员服务

40+阅读 · 2019年10月9日

MIT新书《强化学习与最优控制》

MIT新书《强化学习与最优控制》

专知会员服务

280+阅读 · 2019年10月9日

【电子书推荐】Data Science with Python and Dask

【电子书推荐】Data Science with Python and Dask

专知会员服务

44+阅读 · 2019年6月1日

【Github】All4NLP：自然语言处理相关资源整理

【Github】All4NLP：自然语言处理相关资源整理

AINLP

23+阅读 · 2019年8月9日

（Python）3D人脸处理工具Face3d

（Python）3D人脸处理工具Face3d

AI研习社

7+阅读 · 2019年2月10日

资源 | 谷歌开源AdaNet：基于TensorFlow的AutoML框架

资源 | 谷歌开源AdaNet：基于TensorFlow的AutoML框架

极市平台

4+阅读 · 2018年11月1日

【干货】Python机器学习项目实战1（附代码）

【干货】Python机器学习项目实战1（附代码）

专知

14+阅读 · 2018年5月21日

OpenAI强化学习实战

OpenAI强化学习实战

炼数成金订阅号

9+阅读 · 2018年5月14日

最全数据科学学习资源：Python、线性代数、机器学习...

最全数据科学学习资源：Python、线性代数、机器学习...

人工智能头条

12+阅读 · 2018年5月14日

Coursera上Python课程（公开课）汇总推荐

Coursera上Python课程（公开课）汇总推荐

AINLP

8+阅读 · 2018年3月11日

Coursera上Python课程（公开课）汇总

Coursera上Python课程（公开课）汇总

数据挖掘入门与实战

6+阅读 · 2017年12月27日

送你一份深度学习资源&教程！

送你一份深度学习资源&教程！

THU数据派

13+阅读 · 2017年11月30日

分布式TensorFlow入门指南

分布式TensorFlow入门指南

机器学习研究会

4+阅读 · 2017年11月28日

Do RNN and LSTM have Long Memory?

Do RNN and LSTM have Long Memory?

Arxiv

19+阅读 · 2020年6月10日

A Survey on Edge Intelligence

A Survey on Edge Intelligence

Arxiv

52+阅读 · 2020年3月26日

Hyper-Parameter Optimization: A Review of Algorithms and Applications

Hyper-Parameter Optimization: A Review of Algorithms and Applications

Arxiv

16+阅读 · 2020年3月12日

Fine-tune BERT for Extractive Summarization

Arxiv

3+阅读 · 2019年9月5日

TF-Ranking: Scalable TensorFlow Library for Learning-to-Rank

Arxiv

5+阅读 · 2019年5月17日

Notes on Deep Learning for NLP

Arxiv

22+阅读 · 2018年8月30日

Image Retrieval with Mixed Initiative and Multimodal Feedback

Arxiv

5+阅读 · 2018年5月8日

A Benchmark Study on Sentiment Analysis for Software Engineering Research

Arxiv

3+阅读 · 2018年3月17日

CuLDA_CGS: Solving Large-scale LDA Problems on GPUs

Arxiv

3+阅读 · 2018年3月13日

A Big Data Analysis Framework Using Apache Spark and Deep Learning

Arxiv

3+阅读 · 2017年11月25日

VIP会员

相关主题

数据科学家

相关VIP内容

【干货书】Python机器学习导论，340页pdf数据科学家指南

专知会员服务

175+阅读 · 2020年6月4日

【干货书】用Python进行深思熟虑的机器学习, 216页pdf，Thoughtful ML with Python

【干货书】用Python进行深思熟虑的机器学习, 216页pdf，Thoughtful ML with Python

专知会员服务

70+阅读 · 2020年4月4日

【干货书】机器学习Python实战教程，366页pdf

【干货书】机器学习Python实战教程，366页pdf

专知会员服务

344+阅读 · 2020年3月17日

【新书】Python强化学习-基于Tensorflow与Keras和OpenAI Gym实战, 177页pdf

【新书】Python强化学习-基于Tensorflow与Keras和OpenAI Gym实战, 177页pdf

专知会员服务

184+阅读 · 2020年1月17日

谷歌机器学习速成课程中文版pdf

谷歌机器学习速成课程中文版pdf

专知会员服务

147+阅读 · 2019年12月4日

为机器学习应用实践Scikit-Learn，数据科学基础与Python，247页pdf

为机器学习应用实践Scikit-Learn，数据科学基础与Python，247页pdf

专知会员服务

143+阅读 · 2019年12月1日

【新书】Python编程基础，669页pdf

【新书】Python编程基础，669页pdf

专知会员服务

197+阅读 · 2019年10月10日

机器学习相关资源(框架、库、软件)大列表

机器学习相关资源(框架、库、软件)大列表

专知会员服务

40+阅读 · 2019年10月9日

MIT新书《强化学习与最优控制》

MIT新书《强化学习与最优控制》

专知会员服务

280+阅读 · 2019年10月9日

【电子书推荐】Data Science with Python and Dask

【电子书推荐】Data Science with Python and Dask

专知会员服务

44+阅读 · 2019年6月1日

热门VIP内容

开通专知VIP会员享更多权益服务

《多域空战指挥体系：驾驭复杂性的艺术》

构建军事人工智能信任体系始于破除黑盒机制

《生态建模密码破译：建模与编程实践》美陆军最新报告

《战争形态演变：合成兵种防御主导模式探析》48页slides

相关资讯

【Github】All4NLP：自然语言处理相关资源整理

【Github】All4NLP：自然语言处理相关资源整理

AINLP

23+阅读 · 2019年8月9日

（Python）3D人脸处理工具Face3d

（Python）3D人脸处理工具Face3d

AI研习社

7+阅读 · 2019年2月10日

资源 | 谷歌开源AdaNet：基于TensorFlow的AutoML框架

资源 | 谷歌开源AdaNet：基于TensorFlow的AutoML框架

极市平台

4+阅读 · 2018年11月1日

【干货】Python机器学习项目实战1（附代码）

【干货】Python机器学习项目实战1（附代码）

专知

14+阅读 · 2018年5月21日

OpenAI强化学习实战

OpenAI强化学习实战

炼数成金订阅号

9+阅读 · 2018年5月14日

最全数据科学学习资源：Python、线性代数、机器学习...

最全数据科学学习资源：Python、线性代数、机器学习...

人工智能头条

12+阅读 · 2018年5月14日

Coursera上Python课程（公开课）汇总推荐

Coursera上Python课程（公开课）汇总推荐

AINLP

8+阅读 · 2018年3月11日

Coursera上Python课程（公开课）汇总

Coursera上Python课程（公开课）汇总

数据挖掘入门与实战

6+阅读 · 2017年12月27日

送你一份深度学习资源&教程！

送你一份深度学习资源&教程！

THU数据派

13+阅读 · 2017年11月30日

分布式TensorFlow入门指南

分布式TensorFlow入门指南

机器学习研究会

4+阅读 · 2017年11月28日

相关论文

Do RNN and LSTM have Long Memory?

Do RNN and LSTM have Long Memory?

Arxiv

19+阅读 · 2020年6月10日

A Survey on Edge Intelligence

A Survey on Edge Intelligence

Arxiv

52+阅读 · 2020年3月26日

Hyper-Parameter Optimization: A Review of Algorithms and Applications

Hyper-Parameter Optimization: A Review of Algorithms and Applications

Arxiv

16+阅读 · 2020年3月12日

Fine-tune BERT for Extractive Summarization

Arxiv

3+阅读 · 2019年9月5日

TF-Ranking: Scalable TensorFlow Library for Learning-to-Rank

Arxiv

5+阅读 · 2019年5月17日

Notes on Deep Learning for NLP

Arxiv

22+阅读 · 2018年8月30日

Image Retrieval with Mixed Initiative and Multimodal Feedback

Arxiv

5+阅读 · 2018年5月8日

A Benchmark Study on Sentiment Analysis for Software Engineering Research

Arxiv

3+阅读 · 2018年3月17日

CuLDA_CGS: Solving Large-scale LDA Problems on GPUs

Arxiv

3+阅读 · 2018年3月13日

A Big Data Analysis Framework Using Apache Spark and Deep Learning

Arxiv

3+阅读 · 2017年11月25日

大家都在搜

CMU博士论文

无人机集群

国防科技创新

无人机航拍交通事故现场勘查处置系统——行业第一的警用事故处理软件

微信扫码咨询专知VIP会员