资源 | 基于OpenAI Gym的股票市场交易环境

2017 年 7 月 11 日 机器之心

选自Github

机器之心编译

参与:李泽南


机器学习在股票市场中的应用一直是个吸引人的研究方向,前不久瑞士金融数据顾问的《如何用 Python 和机器学习炒股赚钱?》引起了很多人的关注。目前,在 GitHub 上已经出现了基于 OpenAI Gym 的股票市场交易环境,该项目使用 Keras,支持 Theano 与 TensorFlow,可以帮助开发者导入各类股票市场的交易数据,构建自己的长线交易模型。希望它能为你的研究提供帮助。


项目地址:https://github.com/kh-kim/stock_market_reinforcement_learning


概述


本项目使用 OpenAI Gym 为股票交易市场的模拟提供了一个通用环境。训练数据为每天的收盘价,收集自 Google Finance,当然,你也可以导入其他自己希望使用的数据。另外,它还包含 Andrej Karpathy 曾经提到过的简单 Deep Q-learning 和策略梯度算法。


Andrej Karpathy 的博文《Deep Reinforcement Learning: Pong from Pixels》:http://karpathy.github.io/2016/05/31/rl/


该环境的开发者表示,这个项目不仅是为了帮助人们在股票交易市场中找寻最好的强化学习解决方案,更是通用和开放环境的一部分。


环境需求


  • Python2.7 或更高版本

  • Numpy

  • HDF5

  • Keras 和其基础(Theano 和 TensorFlow 皆可)

  • OpenAI Gym


使用


注意:用于训练的示例数据来自韩国股票市场,如果你想训练本国股票市场的交易数据,请自行下载并导入。


在满足以上开发环境后,你就可以在此之上训练自己的算法、Deep Q-leanring 和策略梯度算法了。


训练 Deep Q-leanring:

$ python market_dqn.py <list filename> [model filename]


训练策略梯度算法:

$ python market_pg.py <list filename> [model filename]


例如,你可以这样做:

$ python market_pg.py ./kospi_10.csv pg.h5


目前,该项目中的神经网络架构略显简单,如果你试图学习每个股票的数据,模型会欠拟合。它只适合 10-100 支股票数年内的数据。作者欢迎其他贡献者提供更好的模型。

下图是 KOSPI 市值前十的股票近四年内的数据,使用了策略梯度算法。




下一步计划


  • 测试环境、检查过拟合

  • 阐述 PG 的训练接口


参考文献


[1] Playing Atari with Deep Reinforcement Learning:https://arxiv.org/abs/1312.5602

[2] Deep Reinforcement Learning: Pong from Pixels:http://karpathy.github.io/2016/05/31/rl/

[3] KEras Reinforcement Learning gYM agents, KeRLym:https://github.com/osh/kerlym

[4] Keras plays catch, a single file Reinforcement Learning example:http://edersantana.github.io/articles/keras_rl/



本文为机器之心编译,转载请联系本公众号获得授权

✄------------------------------------------------

加入机器之心(全职记者/实习生):hr@jiqizhixin.com

投稿或寻求报道:editor@jiqizhixin.com

广告&商务合作:bd@jiqizhixin.com


点击阅读原文,查看机器之心官网↓↓↓

登录查看更多
1

相关内容

OpenAI,由诸多硅谷大亨联合建立的人工智能非营利组织。2015年马斯克与其他硅谷科技大亨进行连续对话后,决定共同创建OpenAI,希望能够预防人工智能的灾难性影响,推动人工智能发挥积极作用。特斯拉电动汽车公司与美国太空技术探索公司SpaceX创始人马斯克、Y Combinator总裁阿尔特曼、天使投资人彼得·泰尔(Peter Thiel)以及其他硅谷巨头去年12月份承诺向OpenAI注资10亿美元。
【实用书】Python机器学习Scikit-Learn应用指南,247页pdf
专知会员服务
264+阅读 · 2020年6月10日
多智能体深度强化学习的若干关键科学问题
专知会员服务
186+阅读 · 2020年5月24日
《深度学习》圣经花书的数学推导、原理与Python代码实现
深度强化学习策略梯度教程,53页ppt
专知会员服务
178+阅读 · 2020年2月1日
【强化学习】深度强化学习初学者指南
专知会员服务
179+阅读 · 2019年12月14日
MIT新书《强化学习与最优控制》
专知会员服务
275+阅读 · 2019年10月9日
专知会员服务
206+阅读 · 2019年8月30日
谷歌足球游戏环境使用介绍
CreateAMind
33+阅读 · 2019年6月27日
基于LSTM深层神经网络的时间序列预测
论智
21+阅读 · 2018年9月4日
OpenAI强化学习实战
炼数成金订阅号
9+阅读 · 2018年5月14日
基于强化学习的量化交易框架
机器学习研究会
28+阅读 · 2018年2月22日
自创数据集,用TensorFlow预测股票教程 !(附代码)
详解TensorForce: 基于TensorFlow建立强化学习API
机械鸡
5+阅读 · 2017年7月22日
Arxiv
22+阅读 · 2018年8月30日
VIP会员
相关VIP内容
【实用书】Python机器学习Scikit-Learn应用指南,247页pdf
专知会员服务
264+阅读 · 2020年6月10日
多智能体深度强化学习的若干关键科学问题
专知会员服务
186+阅读 · 2020年5月24日
《深度学习》圣经花书的数学推导、原理与Python代码实现
深度强化学习策略梯度教程,53页ppt
专知会员服务
178+阅读 · 2020年2月1日
【强化学习】深度强化学习初学者指南
专知会员服务
179+阅读 · 2019年12月14日
MIT新书《强化学习与最优控制》
专知会员服务
275+阅读 · 2019年10月9日
专知会员服务
206+阅读 · 2019年8月30日
相关资讯
谷歌足球游戏环境使用介绍
CreateAMind
33+阅读 · 2019年6月27日
基于LSTM深层神经网络的时间序列预测
论智
21+阅读 · 2018年9月4日
OpenAI强化学习实战
炼数成金订阅号
9+阅读 · 2018年5月14日
基于强化学习的量化交易框架
机器学习研究会
28+阅读 · 2018年2月22日
自创数据集,用TensorFlow预测股票教程 !(附代码)
详解TensorForce: 基于TensorFlow建立强化学习API
机械鸡
5+阅读 · 2017年7月22日
Top
微信扫码咨询专知VIP会员