Analyzing patterns in a sequence of events has applications in text analysis, computer programming, and genomics research. In this paper, we consider the all-window-length analysis model which analyzes a sequence of events with respect to windows of all lengths. We study the exact co-occurrence counting problem for the all-window-length analysis model. Our first algorithm is an offline algorithm that counts all-window-length co-occurrences by performing multiple passes over a sequence and computing single-window-length co-occurrences. This algorithm has the time complexity $O(n)$ for each window length and thus a total complexity of $O(n^2)$ and the space complexity $O(|I|)$ for a sequence of size n and an itemset of size $|I|$. We propose AWLCO, an online algorithm that computes all-window-length co-occurrences in a single pass with the expected time complexity of $O(n)$ and space complexity of $O( \sqrt{ n|I| })$. Following this, we generalize our use case to patterns in which we propose an algorithm that computes all-window-length co-occurrence with expected time complexity $O(n|I|)$ and space complexity $O( \sqrt{n|I|} + e_{max}|I|)$, where $e_{max}$ is the length of the largest pattern.
翻译:一系列事件的分析模式在文本分析、计算机编程和基因组研究中都有应用。 在本文中, 我们考虑全窗口长分析模型, 分析所有长度窗口中的事件序列。 我们研究所有窗口长分析模型的精确共振计数问题。 我们的第一个算法是一个离线算法, 通过对一个序列进行多次传送, 计算单一窗口长的共振。 这个算法具有每个窗口长度的时间复杂性$( n), 从而总复杂度为$( n) $( n) 和空间复杂性$( $( ) 美元) 。 我们建议 AWLCO, 一种计算全窗口长共振的在线算法, 以预期时间复杂性$( n) 美元 (n) 和空间复杂度( n) 美元 (n) 美元 (n) 美元 (n) 美元(n) 和 空间复杂度( ) 美元( ) 美元( ) 美元( ) 美元( ) (n) 美元) 美元( 美元) 美元( ) 美元( 美元) 美元( 美元) 美元( 美元) 美元) 美元( 美元) 美元( 美元) 美元( 美元) ( 美元) ( 美元) ( 美元) (美元) ( 美元) ( 美元) ( 美元) ( 美元) ( 美元) ( 美元) ( 美元) ( 美元) ( 美元) ( 美元) ( 美元) ( 美元) ( 美元) ( 美元) ( 美元) ( 美元) ( 美元) ( 美元) ( ) ( 美元) ( ) ( 美元) ( 美元) ( 美元) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( 美元) ( 美元) ( 美元) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( 美元) ( ) ( 美元) ( ) ( ) ( ) ( ) ( ) ( 美元) (