黄金价格预测:如何将时序数据处理成监督学习数据

2020 年 9 月 8 日 凡人机器学习



背景概述


今天介绍下如何将时序数据处理成监督学习可用的训练样本。比较典型的场景是黄金的原始数据,一般黄金走势数据是由两个字段组成,分别是时间字段和价格字段。

走势图如下:

顺便安利一个黄金数据的下载网址:

https://fred.stlouisfed.org/series/GOLDAMGBD228NLBM



数据滑动窗口原理


那这种时序数据如何转换成包含特征和目标列的监督学习训练样本呢?今天介绍一个叫“数据滑动窗口”的方法。在数据滑动窗口这个方法中,把当前日期叫做t,前一天是t-1,后一天用t+1表示。也就是说假设要预测t+1天的黄金价格的走势,可以把t、t-1、t-2、t-3...这些日期的数据作为特征,t+1天的数据作为目标列去建模。


举个例子,假设要构建2个特征,1个目标列这样的训练样本,使用如下数据集。

训练集可以构建成如下模式,最后一列是目标列:

1125,1121,120.85

1121,1120.85,1122.3

1120.85,1122.3,1107.75

........



代码示例

基于上述网址下载的数据,我用DataFrame的shift函数实现了一个数据处理的示例,原始数据:

处理后的数据:


from pandas import DataFrame

df = DataFrame()

getTex=open('goldPrice.csv')

rawData=[]

for line in getTex.readlines():

   index=line.strip().split(',')

   if index[1]=='.': 

     continue   #filter dirty data   

   rawData.append(index[1])

df['t-1'] = rawData

df['t'] = df['t-1'].shift(-1)

df['t+1'] = df['t-1'].shift(-2)

print(df)


下来做预测就很简单了,可以用xgboost这样的回归算法去基于过去两天的数据预测接下来一天的价格,最终价格可以通过MAE这样的回归算法评估方法去评估。

登录查看更多
2

相关内容

专知会员服务
138+阅读 · 2020年12月3日
最新《对比监督学习》综述论文,20页pdf
专知会员服务
82+阅读 · 2020年11月5日
最新《深度学习视频异常检测》2020综述论文,21页pdf
专知会员服务
84+阅读 · 2020年9月30日
【TAMU】最新《时间序列分析》课程笔记,527页pdf
专知会员服务
179+阅读 · 2020年9月12日
基于深度学习的表面缺陷检测方法综述
专知会员服务
85+阅读 · 2020年5月31日
【Amazon】使用预先训练的Transformer模型进行数据增强
专知会员服务
56+阅读 · 2020年3月6日
机器学习中如何处理不平衡数据?
机器之心
13+阅读 · 2019年2月17日
使用LSTM模型预测股价基于Keras
量化投资与机器学习
34+阅读 · 2018年11月17日
LASSO回归与XGBoost:融合模型预测房价
论智
31+阅读 · 2018年8月8日
基于 Keras 用深度学习预测时间序列
R语言中文社区
23+阅读 · 2018年7月27日
(Python)时序预测的七种方法
云栖社区
10+阅读 · 2018年2月25日
视频 | 如何用 AI 预测股价?
AI研习社
5+阅读 · 2017年6月30日
回归预测&时间序列预测
GBASE数据工程部数据团队
43+阅读 · 2017年5月17日
Arxiv
0+阅读 · 2020年12月3日
Arxiv
0+阅读 · 2020年11月30日
Arxiv
4+阅读 · 2016年9月20日
VIP会员
相关VIP内容
专知会员服务
138+阅读 · 2020年12月3日
最新《对比监督学习》综述论文,20页pdf
专知会员服务
82+阅读 · 2020年11月5日
最新《深度学习视频异常检测》2020综述论文,21页pdf
专知会员服务
84+阅读 · 2020年9月30日
【TAMU】最新《时间序列分析》课程笔记,527页pdf
专知会员服务
179+阅读 · 2020年9月12日
基于深度学习的表面缺陷检测方法综述
专知会员服务
85+阅读 · 2020年5月31日
【Amazon】使用预先训练的Transformer模型进行数据增强
专知会员服务
56+阅读 · 2020年3月6日
相关资讯
机器学习中如何处理不平衡数据?
机器之心
13+阅读 · 2019年2月17日
使用LSTM模型预测股价基于Keras
量化投资与机器学习
34+阅读 · 2018年11月17日
LASSO回归与XGBoost:融合模型预测房价
论智
31+阅读 · 2018年8月8日
基于 Keras 用深度学习预测时间序列
R语言中文社区
23+阅读 · 2018年7月27日
(Python)时序预测的七种方法
云栖社区
10+阅读 · 2018年2月25日
视频 | 如何用 AI 预测股价?
AI研习社
5+阅读 · 2017年6月30日
回归预测&时间序列预测
GBASE数据工程部数据团队
43+阅读 · 2017年5月17日
Top
微信扫码咨询专知VIP会员