人工智能时代的量化投资策略

2017 年 12 月 19 日 七月在线实验室

  时至今日,人工智能的浪潮已经席卷生活中越来越多的领域:语音识别、图像识别、风控监控、智能推荐、无人驾驶……这个单子还可以写很长很长。有句话说得好:世界进步是靠想偷懒的人推动的。机器开始在许多方面逐步代替人类的工作,大大解放了人类的双手,在某些领域还能完成许多人类无法胜任的工作,而且这个趋势还在不断加强。

  人工智能的触角不仅抓住了生活的方方面面,而且对于金融股票也开始有所涉猎。今天我们就谈谈当量化投资邂逅人工智能,可以擦出怎样的火花?



量化投资的概念


  何谓量化投资?它是指通过计算机程序化发出买卖指令,以获取稳定收益为目的的交易方式。量化投资者搜集分析大量的数据后,借助计算机系统强大的信息处理能力,采用先进的数学模型替代人为的主观判断,利用计算机程序付诸实施。量化投资在海外的发展已有30多年的历史,其投资业绩稳定,市场规模和份额不断扩大、得到了越来越多投资者认可。

  量化投资的优势主要有以下几点:严格执行投资策略,不随投资者情绪的变化而随意更改,可以克服人性的贪婪、恐惧、侥幸等心理,避免错失投资良机;计算机可处理海量数据,及时快速地跟踪市场变化,并构建多层次的量化模型,尽力捕捉较好的投资机会;真正解放了人的双手和脑力,无需时刻盯在屏幕前观察股市行情,每日交易完全靠计算机执行,若准确捕捉到投资良机,即可真正做到“人在家中坐,钱到碗里来”。

  在量化投资中,最关键的部分就是量化模型,也称量化策略。通俗地讲,就是预先设定一套固定的逻辑,点名选股及何时买入何时卖出的标准。实盘操作时,实时接收行情数据并进行分析,当达到预先设定的标准时,即自动进行买入卖出的操作。但在实际的操作中,由于市场千变万化,任何量化模型都不可能准确捕捉到投资良机,因此亏损的情况也不可避免。所以,如何构建更为合理的量化模型,尽可能捕捉好的投资机会,增加盈利减少亏损,便成为相关从业者孜孜不倦的追求。

完整的量化策略所包含的内容

  目前,已经有不少较为成熟的量化策略,如均线策略,海龟策略,银行轮动、二八轮动等。下面针对简单的双均线策略做一下介绍,让大家对量化策略如何实现有个大致的了解。



双均线策略


  均线的概念:对于每一个交易日,都可以计算出前N天的移动平均值,然后把这些移动平均值连起来,成为一条线,就叫做N日移动平均线。(当然对于短期投资,也可以按每分钟或每小时的股价进行计算,得到N分钟/小时移动平均线。)

  比如前5个交易日的收盘价分别为10,9,9,10,11元,那么,5日的移动平均股价为9.8元。同理,如果下一个交易日的收盘价为12,那么在下一次计算移动平均值的时候,需要计算9,9,10,11,12元的平均值,也就是10.2元。将这平均值连起来,就是均线。

  如下图所示,收盘价是蓝线,橙色的线表示5日的移动平均线。

  可以看到均线相当于对股票价格做了一个平滑,但整体趋势一致。

  而双均线,顾名思义就是两条天数不同的移动平均线。如图,蓝色的是5天均线,黄色的是10天均线。可见,10天均线明显比5天均线更为平滑,反映在图上是变化更为缓慢。

  金叉与死叉:由时间短的均线(如上图蓝色的线)在下方向上穿越时间长一点的均线(如上图黄色的线),为“金叉”,反之为“死叉”。我们认为,双均线金叉的时候,表明股票处于上涨势头,死叉的时候开始下跌。因此双均线策略为:金叉时买入,死叉时卖出。

  看起来好有道理!如此投资,人生巅峰就在眼前?!

  殊不知,基于当前数据的量化策略都有一个共同特点:滞后性。以双均线策略为例,当出现金叉时,表明股票已经开始上涨了,此时再作出买入决策已有延迟;再加上从提出交易申请到交易成功的时间间隔,交易成功后或许股票已有下跌势头。因此由于滞后性的存在,理论上捕捉到的投资时机不一定能带来收益。

  这时想必会有朋友说:股市又不能预测,那滞后性的问题是不是就无法解决了呢?非也!股市预测,我人工智能可以做!

 


当量化投资邂逅人工智能


  事实上,量化投资和人工智能,本来就是天生的一对。因为量化投资就是利用数学、统计学的方法,结合计算机技术,通过模型从数据中挖掘有望在未来重复的历史规律并加以利用,不计一次的得失,而是以概率取胜。人工智能本身也是以大数据为基础,尤其擅长像金融市场这样数据信息量大、特征维度高、相互关联关系复杂的环境。量化投资结合了人工智能,使得交易模型正在从回溯历史识别发展趋势向实时预测并随时适应新形式而过渡,人工智能作为新工具只会使量化投资更强大。



量化投资实战


  光说不练假把式,下面让我们行动起来,利用LSTM预测一下真实金融数据。主要可分以下几步进行:

  (1)通过合理途径获取到金融历史数据,数据量原则上应当足够大。只有数据量足够大时深度神经网络才能发挥它最佳的功效。股票数据的特征很多,如开盘价、收盘价、买一价、卖一价、持仓量、成交量等。

  (2)数据清理与归一化。获得的海量数据难免会有噪声,即与相邻时刻的数据间差异非常明显的点,一般都是数据统计出错所致。显著的噪声对于深度学习来说会有比较大的影响。需要利用统计分析的方法找到噪声点,并进行清除、插值等去噪操作。归一化就是要把需要处理的数据经过处理后(通过某种算法)限制在需要的一定范围内。首先归一化是为了后面数据处理的方便,其次是保正程序运行时收敛加快。

  (3)特征降维。收集到的数据有可能会有非常多的特征,在机器学习中过多特征不一定能提高识别准确率,反而可能造成过拟合现象,并严重拖慢执行效率。主成分分析法(PCA)是一种常用的降维方法,它能根据特征间的相关性,选择出对识别最有用的特征。下图为PCA降维的效果图,可以看出前七个特征可以基本反映全部的信息量,而后面的特征包含的信息量很少,可以去除。

 

  (4)制作数据集。因为金融数据具有极强的时序特征,我们的预测目标也是根据前一段时间的数据预测接下来一段时间的涨跌情况,因此为数据集添加时序特征是非常有必要的。具体操作是:取当前时刻及其之前的N段数据构成序列,将每一段序列作为一个新的数据点。另外,该学习方法属于监督学习,每一个数据都要有其对应的标签(label),我们取其下一时刻的涨跌情况作为label,按照涨跌幅度分为五类,使其近似满足正态分布。

  (5)划分训练集与测试集。将数据集打乱,取前70%作为训练集,用于学习;后30%作为测试集,用于测试预测准确率。

  (6)构建LSTM神经网络,开始训练。目前成熟的深度学习框架有很多,可以很方便的构建神经网络,如Tensorflow、Caffe、Mxnet、Pytorch等。关于这些框架的使用此处不再说明,大家可以自行参考相关教程。训练结束后,在测试集上测试性能。若性能理想,则可用于编写交易策略;若不理想,可尝试从模型结构、参数等方面进行优化。

  (7)编写交易策略。最简单的策略即根据预测涨跌情况直接进行交易选择,如未来连续几个时间点上涨即买入,连续几个时间点下跌即卖出。当然也可以与一般的交易策略结合,如预测金叉与死叉点等,并加入止盈止损策略。

  下面让我们一起欣赏量化投资与人工智能擦出的美妙火花:

  我们进行了当日短期投资模拟,上图为涨跌情况预测图。其中,红色箭头表示大涨,黄色箭头表示小涨,绿色箭头表示小跌,黑色箭头表示大跌。可见,虽然出现了几次预测相反的情况,但能有效捕捉到几个大涨大跌的点,准确度还是有一定保障的。

  根据制定的简单交易策略,一天内共进行了三笔交易。其中有两笔是盈利的,有一笔是亏损的。由此可见,人工智能对于量化投资能起到一定的辅助作用。

 

将简单的量化投资策略与人工智能相融合,效果大体使人满意。相信随着人工智能技术的不断进步,通过不断的模型和策略优化,这一方向会有长足的发展。七月在线近期也将推出《量化交易策略》课程,手把手教你从无效的市场中赚钱。

详情点击文末“阅读原文”,或者联系客服微信:julyedukefu(扫下面二维码)

登录查看更多
8

相关内容

【DeepMind推荐】居家学习的人工智能干货资源大全集
专知会员服务
108+阅读 · 2020年6月27日
深度学习可解释性研究进展
专知会员服务
97+阅读 · 2020年6月26日
【硬核书】不完全信息决策理论,467页pdf
专知会员服务
351+阅读 · 2020年6月24日
高效医疗图像分析的统一表示
专知会员服务
34+阅读 · 2020年6月23日
专知会员服务
123+阅读 · 2020年3月26日
【德勤】中国人工智能产业白皮书,68页pdf
专知会员服务
301+阅读 · 2019年12月23日
入行量化,你必须知道的几点
深度学习与NLP
12+阅读 · 2019年3月5日
如何迅速提高公司估值?
计算广告
5+阅读 · 2018年5月16日
关注人工智能:人工智能+ 金融添双翼
专知
5+阅读 · 2018年2月5日
Python量化投资实训营
量化投资与机器学习
11+阅读 · 2018年1月30日
抽奖送书 | 用AlphaGo背后的人工智能做金融投资
机器学习算法与Python学习
5+阅读 · 2018年1月27日
投资,重要的是未来
雪球
5+阅读 · 2017年12月17日
量化投资与建模基于贝叶斯系列
量化投资与机器学习
15+阅读 · 2017年7月12日
Arxiv
6+阅读 · 2019年4月8日
CoCoNet: A Collaborative Convolutional Network
Arxiv
6+阅读 · 2019年1月28日
VIP会员
相关VIP内容
【DeepMind推荐】居家学习的人工智能干货资源大全集
专知会员服务
108+阅读 · 2020年6月27日
深度学习可解释性研究进展
专知会员服务
97+阅读 · 2020年6月26日
【硬核书】不完全信息决策理论,467页pdf
专知会员服务
351+阅读 · 2020年6月24日
高效医疗图像分析的统一表示
专知会员服务
34+阅读 · 2020年6月23日
专知会员服务
123+阅读 · 2020年3月26日
【德勤】中国人工智能产业白皮书,68页pdf
专知会员服务
301+阅读 · 2019年12月23日
相关资讯
入行量化,你必须知道的几点
深度学习与NLP
12+阅读 · 2019年3月5日
如何迅速提高公司估值?
计算广告
5+阅读 · 2018年5月16日
关注人工智能:人工智能+ 金融添双翼
专知
5+阅读 · 2018年2月5日
Python量化投资实训营
量化投资与机器学习
11+阅读 · 2018年1月30日
抽奖送书 | 用AlphaGo背后的人工智能做金融投资
机器学习算法与Python学习
5+阅读 · 2018年1月27日
投资,重要的是未来
雪球
5+阅读 · 2017年12月17日
量化投资与建模基于贝叶斯系列
量化投资与机器学习
15+阅读 · 2017年7月12日
Top
微信扫码咨询专知VIP会员