黄金价格预测：如何将时序数据处理成监督学习数据 - 专知

会员服务 ·

0

黄金价格预测：如何将时序数据处理成监督学习数据

2020 年 9 月 8 日 凡人机器学习

背景概述

今天介绍下如何将时序数据处理成监督学习可用的训练样本。比较典型的场景是黄金的原始数据，一般黄金走势数据是由两个字段组成，分别是时间字段和价格字段。

走势图如下：

顺便安利一个黄金数据的下载网址：

https://fred.stlouisfed.org/series/GOLDAMGBD228NLBM

数据滑动窗口原理

那这种时序数据如何转换成包含特征和目标列的监督学习训练样本呢？今天介绍一个叫“数据滑动窗口”的方法。在数据滑动窗口这个方法中，把当前日期叫做t，前一天是t-1，后一天用t+1表示。也就是说假设要预测t+1天的黄金价格的走势，可以把t、t-1、t-2、t-3...这些日期的数据作为特征，t+1天的数据作为目标列去建模。

举个例子，假设要构建2个特征，1个目标列这样的训练样本，使用如下数据集。

训练集可以构建成如下模式，最后一列是目标列：

1125，1121，120.85

1121，1120.85，1122.3

1120.85，1122.3，1107.75

........

代码示例

基于上述网址下载的数据，我用DataFrame的shift函数实现了一个数据处理的示例，原始数据：

处理后的数据：

from pandas import DataFrame

df = DataFrame()

getTex=open('goldPrice.csv')

rawData=[]

for line in getTex.readlines():

index=line.strip().split(',')

if index[1]=='.':

continue #filter dirty data

rawData.append(index[1])

df['t-1'] = rawData

df['t'] = df['t-1'].shift(-1)

df['t+1'] = df['t-1'].shift(-2)

print(df)

接下来做预测就很简单了，可以用xgboost这样的回归算法去基于过去两天的数据预测接下来一天的价格，最终价格可以通过MAE这样的回归算法评估方法去评估。

登录查看更多

2

相关内容

时序数据

【斯坦福经典书】概率理论，400页pdf

专知会员服务

143+阅读 · 2020年12月3日

最新《对比监督学习》综述论文，20页pdf

最新《对比监督学习》综述论文，20页pdf

专知会员服务

85+阅读 · 2020年11月5日

【2020新书】使用SAS Studio学习数据科学，这是一个快速入门指南

【2020新书】使用SAS Studio学习数据科学，这是一个快速入门指南

专知会员服务

17+阅读 · 2020年10月2日

最新《深度学习视频异常检测》2020综述论文，21页pdf

最新《深度学习视频异常检测》2020综述论文，21页pdf

专知会员服务

86+阅读 · 2020年9月30日

【TAMU】最新《时间序列分析》课程笔记，527页pdf

【TAMU】最新《时间序列分析》课程笔记，527页pdf

专知会员服务

182+阅读 · 2020年9月12日

最新《数据因果性学习: 问题与方法》2020综述论文，36页pdf

最新《数据因果性学习: 问题与方法》2020综述论文，36页pdf

专知会员服务

154+阅读 · 2020年8月16日

NLP基础任务《文本分类算法》大综述最新版, 68页超详细解析

NLP基础任务《文本分类算法》大综述最新版, 68页超详细解析

专知会员服务

75+阅读 · 2020年7月30日

基于深度学习的表面缺陷检测方法综述

基于深度学习的表面缺陷检测方法综述

专知会员服务

87+阅读 · 2020年5月31日

【Amazon】使用预先训练的Transformer模型进行数据增强

【Amazon】使用预先训练的Transformer模型进行数据增强

专知会员服务

57+阅读 · 2020年3月6日

开源新书《时间序列分析，数据/方法/应用》，6章110页pdf带你了解最新进展，附下载

开源新书《时间序列分析，数据/方法/应用》，6章110页pdf带你了解最新进展，附下载

专知会员服务

203+阅读 · 2019年11月20日

机器学习中如何处理不平衡数据？

机器学习中如何处理不平衡数据？

机器之心

13+阅读 · 2019年2月17日

手把手教你用Python玩转时序数据，从采样、预测到聚类丨代码

手把手教你用Python玩转时序数据，从采样、预测到聚类丨代码

量子位

6+阅读 · 2019年2月11日

使用LSTM模型预测股价基于Keras

使用LSTM模型预测股价基于Keras

量化投资与机器学习

35+阅读 · 2018年11月17日

机器学习开放课程：九、基于Python分析真实手游时序数据

机器学习开放课程：九、基于Python分析真实手游时序数据

论智

9+阅读 · 2018年9月2日

LASSO回归与XGBoost：融合模型预测房价

LASSO回归与XGBoost：融合模型预测房价

论智

32+阅读 · 2018年8月8日

基于 Keras 用深度学习预测时间序列

基于 Keras 用深度学习预测时间序列

R语言中文社区

23+阅读 · 2018年7月27日

(Python)时序预测的七种方法

(Python)时序预测的七种方法

云栖社区

10+阅读 · 2018年2月25日

如何用sklearn创建机器学习分类器？这里有一份上手指南

如何用sklearn创建机器学习分类器？这里有一份上手指南

量子位

11+阅读 · 2018年1月17日

视频 | 如何用 AI 预测股价？

视频 | 如何用 AI 预测股价？

AI研习社

5+阅读 · 2017年6月30日

回归预测&时间序列预测

回归预测&时间序列预测

GBASE数据工程部数据团队

44+阅读 · 2017年5月17日

A similarity-based Bayesian mixture-of-experts model

Arxiv

0+阅读 · 2020年12月3日

Regularised Least-Squares Regression with Infinite-Dimensional Output Space

Arxiv

0+阅读 · 2020年12月3日

Short-Term Flow-Based Bandwidth Forecasting using Machine Learning

Arxiv

0+阅读 · 2020年12月3日

Semi-Mechanistic Bayesian Modeling of COVID-19 with Renewal Processes

Arxiv

0+阅读 · 2020年12月1日

Forecasting Characteristic 3D Poses of Human Actions

Arxiv

0+阅读 · 2020年11月30日

Task Programming: Learning Data Efficient Behavior Representations

Arxiv

1+阅读 · 2020年11月27日

Prediction in ungauged regions with sparse flow duration curves and input-selection ensemble modeling

Arxiv

0+阅读 · 2020年11月26日

Analyzing the Machine Learning Conference Review Process

Arxiv

0+阅读 · 2020年11月26日

Functional Time Series Forecasting: Functional Singular Spectrum Analysis Approaches

Arxiv

0+阅读 · 2020年11月26日

Deep CTR Prediction in Display Advertising

Arxiv

4+阅读 · 2016年9月20日

VIP会员

相关主题

相关VIP内容

【斯坦福经典书】概率理论，400页pdf

专知会员服务

143+阅读 · 2020年12月3日

最新《对比监督学习》综述论文，20页pdf

最新《对比监督学习》综述论文，20页pdf

专知会员服务

85+阅读 · 2020年11月5日

【2020新书】使用SAS Studio学习数据科学，这是一个快速入门指南

【2020新书】使用SAS Studio学习数据科学，这是一个快速入门指南

专知会员服务

17+阅读 · 2020年10月2日

最新《深度学习视频异常检测》2020综述论文，21页pdf

最新《深度学习视频异常检测》2020综述论文，21页pdf

专知会员服务

86+阅读 · 2020年9月30日

【TAMU】最新《时间序列分析》课程笔记，527页pdf

【TAMU】最新《时间序列分析》课程笔记，527页pdf

专知会员服务

182+阅读 · 2020年9月12日

最新《数据因果性学习: 问题与方法》2020综述论文，36页pdf

最新《数据因果性学习: 问题与方法》2020综述论文，36页pdf

专知会员服务

154+阅读 · 2020年8月16日

NLP基础任务《文本分类算法》大综述最新版, 68页超详细解析

NLP基础任务《文本分类算法》大综述最新版, 68页超详细解析

专知会员服务

75+阅读 · 2020年7月30日

基于深度学习的表面缺陷检测方法综述

基于深度学习的表面缺陷检测方法综述

专知会员服务

87+阅读 · 2020年5月31日

【Amazon】使用预先训练的Transformer模型进行数据增强

【Amazon】使用预先训练的Transformer模型进行数据增强

专知会员服务

57+阅读 · 2020年3月6日

开源新书《时间序列分析，数据/方法/应用》，6章110页pdf带你了解最新进展，附下载

开源新书《时间序列分析，数据/方法/应用》，6章110页pdf带你了解最新进展，附下载

专知会员服务

203+阅读 · 2019年11月20日

热门VIP内容

开通专知VIP会员享更多权益服务

【新书】面向企业的图学习扩展：生产级图学习与推理，485页pdf

AI智能体编程：技术、挑战与机遇综述

【国家标准】数据安全技术数据安全风险评估方法

【CMU博士论文】交互式学习的进展：替代性反馈机制与自适应因果推理

相关资讯

机器学习中如何处理不平衡数据？

机器学习中如何处理不平衡数据？

机器之心

13+阅读 · 2019年2月17日

手把手教你用Python玩转时序数据，从采样、预测到聚类丨代码

手把手教你用Python玩转时序数据，从采样、预测到聚类丨代码

量子位

6+阅读 · 2019年2月11日

使用LSTM模型预测股价基于Keras

使用LSTM模型预测股价基于Keras

量化投资与机器学习

35+阅读 · 2018年11月17日

机器学习开放课程：九、基于Python分析真实手游时序数据

机器学习开放课程：九、基于Python分析真实手游时序数据

论智

9+阅读 · 2018年9月2日

LASSO回归与XGBoost：融合模型预测房价

LASSO回归与XGBoost：融合模型预测房价

论智

32+阅读 · 2018年8月8日

基于 Keras 用深度学习预测时间序列

基于 Keras 用深度学习预测时间序列

R语言中文社区

23+阅读 · 2018年7月27日

(Python)时序预测的七种方法

(Python)时序预测的七种方法

云栖社区

10+阅读 · 2018年2月25日

如何用sklearn创建机器学习分类器？这里有一份上手指南

如何用sklearn创建机器学习分类器？这里有一份上手指南

量子位

11+阅读 · 2018年1月17日

视频 | 如何用 AI 预测股价？

视频 | 如何用 AI 预测股价？

AI研习社

5+阅读 · 2017年6月30日

回归预测&时间序列预测

回归预测&时间序列预测

GBASE数据工程部数据团队

44+阅读 · 2017年5月17日

相关论文

A similarity-based Bayesian mixture-of-experts model

Arxiv

0+阅读 · 2020年12月3日

Regularised Least-Squares Regression with Infinite-Dimensional Output Space

Arxiv

0+阅读 · 2020年12月3日

Short-Term Flow-Based Bandwidth Forecasting using Machine Learning

Arxiv

0+阅读 · 2020年12月3日

Semi-Mechanistic Bayesian Modeling of COVID-19 with Renewal Processes

Arxiv

0+阅读 · 2020年12月1日

Forecasting Characteristic 3D Poses of Human Actions

Arxiv

0+阅读 · 2020年11月30日

Task Programming: Learning Data Efficient Behavior Representations

Arxiv

1+阅读 · 2020年11月27日

Prediction in ungauged regions with sparse flow duration curves and input-selection ensemble modeling

Arxiv

0+阅读 · 2020年11月26日

Analyzing the Machine Learning Conference Review Process

Arxiv

0+阅读 · 2020年11月26日

Functional Time Series Forecasting: Functional Singular Spectrum Analysis Approaches

Arxiv

0+阅读 · 2020年11月26日

Deep CTR Prediction in Display Advertising

Arxiv

4+阅读 · 2016年9月20日

大家都在搜

软件无线电

CMU博士论文

无人机集群

久别重逢话双塔

国防科技创新

无人机测控通信自组网技术综述

微信扫码咨询专知VIP会员