The behavior of the leading singular values and vectors of noisy low-rank matrices is fundamental to many statistical and scientific problems. Theoretical understanding currently derives from asymptotic analysis under one of two regimes: {\it classical}, with a fixed number of rows, large number of columns or vice versa; and {\it proportional}, with large numbers of rows and columns, proportional to one another. This paper is concerned with the {\it disproportional} regime, where the matrix is either `tall and narrow' or `short and wide': we study sequences of matrices of size $n \times m_n$ with aspect ratio $ n/m_n \rightarrow 0$ or $n/m_n \rightarrow \infty$ as $n \rightarrow \infty$. This regime has important `big data' applications. Theory derived here shows that the displacement of the empirical singular values and vectors from their noise-free counterparts and the associated phase transitions -- well-known under proportional growth asymptotics -- still occur in the disproportionate setting. They must be quantified, however, on a novel scale of measurement that adjusts with the changing aspect ratio as the matrix size increases. In this setting, the top singular vectors corresponding to the longer of the two matrix dimensions are asymptotically uncorrelated with the noise-free signal.


翻译:噪音低位矩阵的主要单值和矢量的行为对于许多统计和科学问题来说至关重要。 理论理解目前源于两个制度之一下的无时制分析: 立古典}, 以固定的行数、 大量列数或反之以反之; 和 立正成比例}, 以大量行和列相成比例。 本文涉及“ 不相称” 制度, 即矩阵要么“ 完全和狭小”, 要么“ 短暂和宽度” : 我们研究规模为 $\ time m_ n_ n$ 的矩阵序列, 其侧面比率为 n/ m_ n_ right $ or $/ m_ n_ right_ n_ n_ n_ n_ right\ infty $ $ 。 这个制度有着重要的“ 大数据” 应用程序。 这里得出的理论显示, 经验单值和矢量从它们的无噪度对应方和相关的阶段转换 — 众所周知, 以比例增长为比例为奇闻名, 度增长下的矩阵的矩阵规模将随着直观度调整, 上层的缩缩缩缩缩缩缩缩到缩缩缩缩缩到缩缩缩。

0
下载
关闭预览

相关内容

专知会员服务
17+阅读 · 2020年9月6日
2019年机器学习框架回顾
专知会员服务
35+阅读 · 2019年10月11日
【新书】Python编程基础,669页pdf
专知会员服务
193+阅读 · 2019年10月10日
机器学习入门的经验与建议
专知会员服务
92+阅读 · 2019年10月10日
已删除
将门创投
7+阅读 · 2018年4月25日
Arxiv
3+阅读 · 2018年10月18日
VIP会员
相关资讯
已删除
将门创投
7+阅读 · 2018年4月25日
Top
微信扫码咨询专知VIP会员