The likelihood ratio test (LRT) based on the asymptotic chi-squared distribution of the log likelihood is one of the fundamental tools of statistical inference. A recent universal LRT approach based on sample splitting provides valid hypothesis tests and confidence sets in any setting for which we can compute the split likelihood ratio statistic (or, more generally, an upper bound on the null maximum likelihood). The universal LRT is valid in finite samples and without regularity conditions. This test empowers statisticians to construct tests in settings for which no valid hypothesis test previously existed. For the simple but fundamental case of testing the population mean of d-dimensional Gaussian data, the usual LRT itself applies and thus serves as a perfect test bed to compare against the universal LRT. This work presents the first in-depth exploration of the size, power, and relationships between several universal LRT variants. We show that a repeated subsampling approach is the best choice in terms of size and power. We observe reasonable performance even in a high-dimensional setting, where the expected squared radius of the best universal LRT confidence set is approximately 3/2 times the squared radius of the standard LRT-based set. We illustrate the benefits of the universal LRT through testing a non-convex doughnut-shaped null hypothesis, where a universal inference procedure can have higher power than a standard approach.
翻译:依据对日志进行无症状的奇差分布的可能性比率测试(LRT)基于对日志可能性的无症状的分布,是统计推断的基本工具之一。最近基于抽样分割的普遍 LRT 方法提供了有效的假设测试和信任,在我们可以计算不同概率统计(或更笼统地说,无最大可能性的上限)的任何环境中提供了有效的假设测试和信心。通用 LRT 方法在有限样本中有效,没有规律性条件。这一测试使统计人员能够在以前没有有效假设测试的环境下进行测试。对于测试D维高斯数据的人口平均值这一简单而基本的情况,通常的 LRT 方法本身适用,从而成为与通用 LRT 比较的完美测试床。这项工作首次深入探索了多个通用 LRT 变量之间的大小、权力和关系。我们表明,重复的子抽样方法是在规模和权力方面的最佳选择。我们观察到了合理的业绩,即使在高尺度环境中,最佳通用LRT 信心设定的预期平方半径大约是标准LRT 标准平方平方平方平方平方平方平方平方平方平方平方平方平方平方平方平方平方平方平方平方平方平方平方平方平方平方平方平方平方平方平方平方平方平方平方平方平方平方平方平方平方平方平方平方平方平方平方平方平方平方平方平方平方平方平方平方平方平方平方平方平方平方平方平方平方平方平方平方平方平方平方平方平方平方平方平方平方平方平方平方平方平方平方平方平方平方平方平方平方平方平方平方平方平方平方平方平方平方平方平方平方平方平方平方平方平方平方平方平方平方平方平方平方平方平方平方平方平方平方平方平方平方平方平方平方平方平方平方平方平方平方平方平方平方平方平方平方平方平方平方平方平方平方平方平方平方平方平