时间序列分类问题采用监督机器学习技术来分析时间上的有序数据并对新的连续数据进行分类。近年来,随着时间序列数据访问量的增加,时间序列分类越来越受欢迎,问题出现在广泛的应用中,如音频记录、医疗信号和天气预测。一般来说,有一个假设,即时间排序是均匀的或接近均匀采样的。然而,在一些重要的应用中,情况并非如此。

这个项目研究了一个数据集,它是一个非常不均匀采样的时间序列,任务是对三个标签进行分类。该数据集也相当大,需要非常高维的特征。这些考虑促使我们使用了顺序学习技术。顺序(序列)学习是指以数据序列作为输入或输出的机器学习模型。这个项目的目标是确定预处理技术和生成序列的方法,这将有助于这个分类任务。如果成功的话,其结果可以帮助深入了解类似的序列学习问题。

首先对整个数据集的数据进行了标准化。给定的数据有很大的时间间隔,其中没有样本,被称为 "死区",通过插值和零均值填充的过程人为地填补了这些空白。还创建了一个相对时间编码特征,以帮助预测者解释数据突发之间的时间量。分割是为了保持一个窗口的序列长度,同时增加它所代表的时间长度。

一个共同的最佳预测器被确定为(D, N, P, S)=(8, 644616, 250, S/8),其中D代表抽取因子,N代表训练中使用的序列数,P代表窗口长度,S代表步幅。研究发现,存在一个近似的时间长度,大致等于2120个样本,使这种分类的性能达到最佳。

成为VIP会员查看完整内容
31

相关内容

人工智能在军事中可用于多项任务,例如目标识别、大数据处理、作战系统、网络安全、后勤运输、战争医疗、威胁和安全监测以及战斗模拟和训练。
最新《时序数据分析》书稿,512页pdf
专知会员服务
112+阅读 · 2020年12月25日
【MIT经典书】统计学习与序列预测,261页pdf
专知会员服务
76+阅读 · 2020年11月17日
推荐系统概述
Python开发者
11+阅读 · 2018年9月27日
R语言之数据分析高级方法「时间序列」
R语言中文社区
17+阅读 · 2018年4月24日
机器学习(30)之线性判别分析(LDA)原理详解
机器学习算法与Python学习
11+阅读 · 2017年12月6日
最全的DNN概述论文:详解前馈、卷积和循环神经网络技术
基于LDA的主题模型实践(一)
机器学习深度学习实战原创交流
20+阅读 · 2015年9月9日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
3+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
Arxiv
0+阅读 · 2022年10月31日
Arxiv
0+阅读 · 2022年10月30日
Arxiv
19+阅读 · 2022年7月29日
Arxiv
12+阅读 · 2022年4月30日
已删除
Arxiv
32+阅读 · 2020年3月23日
VIP会员
相关VIP内容
最新《时序数据分析》书稿,512页pdf
专知会员服务
112+阅读 · 2020年12月25日
【MIT经典书】统计学习与序列预测,261页pdf
专知会员服务
76+阅读 · 2020年11月17日
相关基金
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
3+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
微信扫码咨询专知VIP会员