Processing and analyzing time series data\-sets have become a central issue in many domains requiring data management systems to support time series as a native data type. A crucial prerequisite of these systems is time series matching, which still is a challenging problem. A time series is a high-dimensional data type, its representation is storage-, and its comparison is time-consuming. Among the representation techniques that tackle these challenges, the symbolic aggregate approximation (SAX) is the current state of the art. This technique reduces a time series to a low-dimensional space by segmenting it and discretizing each segment into a small symbolic alphabet. However, SAX ignores the deterministic behavior of time series such as cyclical repeating patterns or trend component affecting all segments and leading to a distortion of the symbolic distribution. In this paper, we present a season- and a trend-aware symbolic approximation. We show that this improves the symbolic distribution and increase the representation accuracy without increasing its memory footprint. Most importantly, this enables a more efficient time series matching by providing a match up to three orders of magnitude faster than SAX.


翻译:处理和分析时间序列数据集已经成为许多领域的核心问题,这些领域需要数据管理系统支持时间序列,作为本地数据类型。这些系统的关键先决条件是时间序列匹配,这仍然是一个挑战性的问题。时间序列是一个高维数据类型,其代表性是存储,其比较是耗时的。在应对这些挑战的表述技术中,符号综合近似(SAX)是当前的最新状态。这一技术通过将一个时间序列分割成一个小的符号字母,将一个时间序列降低到一个低维空间。然而,SAX忽略了时间序列的确定性行为,例如周期性重复模式或影响所有部分的趋势部分,导致象征性分布的扭曲。在本文中,我们展示了一个季节和趋势认知符号近似。我们表明,这在不增加记忆足迹的情况下改进了象征性分布,提高了代表的准确性。最重要的是,通过提供比SAX更快的三个数量级的匹配,使得一个更高效的时间序列能够匹配。

0
下载
关闭预览

相关内容

基于深度学习的手语识别综述
专知会员服务
46+阅读 · 2020年5月18日
【干货书】真实机器学习,264页pdf,Real-World Machine Learning
专知会员服务
60+阅读 · 2020年3月19日
【哈佛大学商学院课程Fall 2019】机器学习可解释性
专知会员服务
103+阅读 · 2019年10月9日
【SIGGRAPH2019】TensorFlow 2.0深度学习计算机图形学应用
专知会员服务
39+阅读 · 2019年10月9日
已删除
将门创投
3+阅读 · 2019年11月25日
Hierarchically Structured Meta-learning
CreateAMind
26+阅读 · 2019年5月22日
IEEE | DSC 2019诚邀稿件 (EI检索)
Call4Papers
10+阅读 · 2019年2月25日
计算机类 | 期刊专刊截稿信息9条
Call4Papers
4+阅读 · 2018年1月26日
Arxiv
0+阅读 · 2021年7月22日
Arxiv
0+阅读 · 2021年7月22日
Arxiv
0+阅读 · 2021年7月20日
VIP会员
相关资讯
已删除
将门创投
3+阅读 · 2019年11月25日
Hierarchically Structured Meta-learning
CreateAMind
26+阅读 · 2019年5月22日
IEEE | DSC 2019诚邀稿件 (EI检索)
Call4Papers
10+阅读 · 2019年2月25日
计算机类 | 期刊专刊截稿信息9条
Call4Papers
4+阅读 · 2018年1月26日
Top
微信扫码咨询专知VIP会员