Analyzing patterns in a sequence of events has applications in text analysis, computer programming, and genomics research. In this paper, we consider the all-window-length analysis model which analyzes a sequence of events with respect to windows of all lengths. We study the exact co-occurrence counting problem for the all-window-length analysis model. Our first algorithm is an offline algorithm that counts all-window-length co-occurrences by performing multiple passes over a sequence and computing single-window-length co-occurrences. This algorithm has the time complexity $O(n)$ for each window length and thus a total complexity of $O(n^2)$ and the space complexity $O(|I|)$ for a sequence of size n and an itemset of size $|I|$. We propose AWLCO, an online algorithm that computes all-window-length co-occurrences in a single pass with the expected time complexity of $O(n)$ and space complexity of $O( \sqrt{ n|I| })$. Following this, we generalize our use case to patterns in which we propose an algorithm that computes all-window-length co-occurrence with expected time complexity $O(n|I|)$ and space complexity $O( \sqrt{n|I|} + e_{max}|I|)$, where $e_{max}$ is the length of the largest pattern.


翻译:一系列事件的分析模式在文本分析、计算机编程和基因组研究中都有应用。 在本文中, 我们考虑全窗口长分析模型, 分析所有长度窗口中的事件序列。 我们研究所有窗口长分析模型的精确共振计数问题。 我们的第一个算法是一个离线算法, 通过对一个序列进行多次传送, 计算单一窗口长的共振。 这个算法具有每个窗口长度的时间复杂性$( n), 从而总复杂度为$( n) $( n) 和空间复杂性$( $( ) 美元) 。 我们建议 AWLCO, 一种计算全窗口长共振的在线算法, 以预期时间复杂性$( n) 美元 (n) 和空间复杂度( n) 美元 (n) 美元 (n) 美元 (n) 美元(n) 和 空间复杂度( ) 美元( ) 美元( ) 美元( ) 美元( ) (n) 美元) 美元( 美元) 美元( ) 美元( 美元) 美元( 美元) 美元( 美元) 美元) 美元( 美元) 美元( 美元) 美元( 美元) ( 美元) ( 美元) ( 美元) (美元) ( 美元) ( 美元) ( 美元) ( 美元) ( 美元) ( 美元) ( 美元) ( 美元) ( 美元) ( 美元) ( 美元) ( 美元) ( 美元) ( 美元) ( 美元) ( 美元) ( 美元) ( 美元) ( ) ( 美元) ( ) ( 美元) ( 美元) ( 美元) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( 美元) ( 美元) ( 美元) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( 美元) ( ) ( 美元) ( ) ( ) ( ) ( ) ( ) ( 美元) (

0
下载
关闭预览

相关内容

区块链白皮书(2020年),60页pdf
专知会员服务
91+阅读 · 2021年1月5日
专知会员服务
50+阅读 · 2020年12月14日
最新《序列预测问题导论》教程,212页ppt
专知会员服务
84+阅读 · 2020年8月22日
专知会员服务
15+阅读 · 2020年7月27日
Stabilizing Transformers for Reinforcement Learning
专知会员服务
58+阅读 · 2019年10月17日
【新书】Python编程基础,669页pdf
专知会员服务
194+阅读 · 2019年10月10日
已删除
将门创投
13+阅读 · 2019年4月17日
【推荐】RNN/LSTM时序预测
机器学习研究会
25+阅读 · 2017年9月8日
Arxiv
0+阅读 · 2021年1月14日
Memory-Gated Recurrent Networks
Arxiv
12+阅读 · 2020年12月24日
Music Transformer
Arxiv
5+阅读 · 2018年12月12日
Arxiv
4+阅读 · 2018年10月31日
Relational recurrent neural networks
Arxiv
8+阅读 · 2018年6月28日
VIP会员
相关VIP内容
区块链白皮书(2020年),60页pdf
专知会员服务
91+阅读 · 2021年1月5日
专知会员服务
50+阅读 · 2020年12月14日
最新《序列预测问题导论》教程,212页ppt
专知会员服务
84+阅读 · 2020年8月22日
专知会员服务
15+阅读 · 2020年7月27日
Stabilizing Transformers for Reinforcement Learning
专知会员服务
58+阅读 · 2019年10月17日
【新书】Python编程基础,669页pdf
专知会员服务
194+阅读 · 2019年10月10日
相关资讯
已删除
将门创投
13+阅读 · 2019年4月17日
【推荐】RNN/LSTM时序预测
机器学习研究会
25+阅读 · 2017年9月8日
相关论文
Arxiv
0+阅读 · 2021年1月14日
Memory-Gated Recurrent Networks
Arxiv
12+阅读 · 2020年12月24日
Music Transformer
Arxiv
5+阅读 · 2018年12月12日
Arxiv
4+阅读 · 2018年10月31日
Relational recurrent neural networks
Arxiv
8+阅读 · 2018年6月28日
Top
微信扫码咨询专知VIP会员