The Householder algorithm for the QR factorization of a tall thin n x p full-rank matrix X has the added bonus of producing a matrix M with orthonormal columns that are a basis for the orthocomplement of the column space of X. We give a simple formula for M-Transpose x when x is in that orthocomplement. The formula does not require computing M, it only requires the R factor of a QR factorization. This is used to get a remarkably simple computable concrete representation of independent "residuals" in classical linear regression. For Students problem, when p=1, if R(j)=Y(j)-Ybar are the usual (non-independent) residuals, W(j)=R(j+1) - R(1)/(sqrt(n)+1) gives n-1 i.i.d. mean-zero normal variables whose sum of squares is the same as that of the n residuals. Those properties of this formula can (in hindsight) easily be verified directly, yielding a new simple and concrete proof of Student's theorem. It also gives a simple way of generating n-1 exactly mean-zero i.i.d. samples from n samples with unknown mean. Yiping Cheng exhibited concrete linear combinations of the Y(j) with these properties, in the context of a constructive proof of Student's theorem, but that representation is not so simple. Analogous simple results are obtained for regression when there are more predictors, giving a very simple computable concrete formula for n-p i.i.d. independent residuals with the same sum of squares as that of the usual n non-independent residuals. A connection with Cochran's theorem is discussed.
翻译:用于高瘦 n x p 全端 矩阵 X 的 QR 乘数算法, 附加的红利是生成一个矩阵M 和正态列列列, 作为 X 列空间的正弦化基础的矩阵M 。 当 x 处于此正弦化中时, 我们给 M- Transplace x 提供一个简单的公式。 该公式不需要计算 M, 只需要 QR 乘数的 R 乘数 。 用于在经典线性回归中获得一个非常简单的可计算的具体表达器 。 对于学生来说, 如果 R( j) = Y( j) - Ybar 是常态( 非独立) 的复数 。 如果 R (j) = R( R)+1) - R(1)/ ( sqrt( n)+1) 给予 n. d. 平均- 正常变量, 这些变量的总和是 n 剩余值 。 这个公式的属性可以很容易被直接校验, 如果 Ral- blight 和常态 直径 的正态 的正态, 则产生新的 n- 直径 和正态 直径 的正态 的正态 。 在正态 的 的 正在态 的 的 的, 直观的 直观的 的 的 。 直观的 和正态的 直观的正态的 的 的 。 。 直方的 的 的 。 直观的 。 直方的 。 。 的 的 的 和 直观的 。 的 的 的 的 的 。 直方的 直方的 直方的 以 直方的 。