Let $T_0$ be the transition matrix of a purely clustered Markov chain, i.e. a direct sum of $k \geq 2$ irreducible stochastic matrices. Given a perturbation $T(x) = T_0 + xE$ of $T_0$ such that $T(x)$ is also stochastic, how small must $x$ be in order for us to recover the indices of the direct summands of $T_0$? We give a simple algorithm based on the orthogonal projection matrix onto the left or right singular subspace corresponding to the $k$ smallest singular values of $I - T(x)$ which allows for exact recovery all clusters when $x = O\left(\frac{\sigma_{n - k}}{||E||_2\sqrt{n_1}}\right)$ and approximate recovery of a single cluster when $x = O\left(\frac{\sigma_{n - k}}{||E||_2}\right)$, where $n_1$ is the size of the largest cluster and $\sigma_{n - k}$ the $(k + 1)$st smallest singular value of $T_0$.
翻译:$T_ 0美元 应该是纯组合的 Markov 链块的过渡矩阵, 即 美元\ geq 2 的直等和, 即 美元= 2 美元, 不可降低的随机分析矩阵 。 鉴于 美元( x) = T_ 0 + x E 美元, 美元= T_ 0 美元, 因此$( x) 美元也是随机的, 美元必须多小, 才能让我们恢复直接总和( $_ 0 美元) 的指数? 我们给出了一个简单的算法, 以左上或右侧的正方投影矩阵为基础, 相当于 美元 - T (x) 美元 = T 美元 美元 最小的单方值。 当 美元= O\ fraft( gman) - k+ 美元时, 美元可以准确恢复所有组群 。 当 美元= O\ 美元= O\ gman 最小的值时, 美元= 美元+ 美元= gma 1 美元 和 美元 美元 最大组的最小值时, 美元= 美元= gma 美元= 美元= 美元= gma 1 最小的最小值时, 。