The behavior of the leading singular values and vectors of noisy low-rank matrices is fundamental to many statistical and scientific problems. Theoretical understanding currently derives from asymptotic analysis under one of two regimes: ${\it classical}$, with a fixed number of rows, large number of columns or vice versa; and ${\it proportional}$, with large numbers of rows and columns, proportional to one another. This paper is concerned with the ${\it disproportional}$ regime, where the matrix is either `tall and narrow' or `short and wide': we study sequences of matrices of size $n \times m_n$ with aspect ratio $ n/m_n \rightarrow 0$ or $n/m_n \rightarrow \infty$ as $n \rightarrow \infty$. This regime has important `big data' applications. Theory derived here shows that the displacement of the empirical singular values and vectors from their noise-free counterparts and the associated phase transitions -- well-known under proportional growth asymptotics -- still occur in the disproportionate setting. They must be quantified, however, on a novel scale of measurement that adjusts with the changing aspect ratio as the matrix size increases. In this setting, the top singular vectors corresponding to the longer of the two matrix dimensions are asymptotically uncorrelated with the noise-free signal.
翻译:噪音低位矩阵中的主要单值和矢量的行为对于许多统计和科学问题至关重要。 理论理解目前源于两个制度之一下的零时分析: 美元( 古典) 美元( 固定行数)、 大量列数或反之反之; 美元( 成比例) 美元( 成行数和列数) 美元( 成比例) 美元( 成比例数) 美元( 成比例数) 。 本文涉及美元( 成比例数) 制度。 美元( 成比例) 与美元( 成比例) 有关, 矩阵要么是“ 完全和狭窄”, 要么是“ 短暂和宽度”, 要么是“ 粗度”, 要么是“ 粗度” 或“ 短度” 。 我们研究的是, 在两个制度下, 大小 大小 大小 大小 大小 的大小 的 比例 比例 比例 比例 比例 比例 比例 比例 比例 和 比例 比例 比例 比例 比例 的 比例 比例 比例 比例 比例 比例 比例 比例 比例 比例 比例 比例 比例 的 比例 比例 比例 比例 比例 比例 比例 比例 定 的 的 比例 比例 比例 的 比例 比例 比例 比例 比例 比例 比例 比例 比例 比例 定 的 定 的 的 比例 比例 比例 比例 比例 比例 比例 比例 比例 比例 比例 比例 比例 比例 比例 比例 比例 比例 比例 的 定 定 的 定 定 定 定 的 的 定 定 定 的 定 定 定 的 定 定 定 定 定 定 定 定 定 定 定 定 定 定 定 定 定 定 的 的 比例 比例 比例 的 的 的 定 定 定 定 定 定 定 定 定 定 定 定 定 定 定 定 定 定 定 定 定 定 定 定 定 定 定 定