Pearson's chi-squared test is widely used to test the goodness of fit between categorical data and a given discrete distribution function. When the number of sets of the categorical data, say $k$, is a fixed integer, Pearson's chi-squared test statistic converges in distribution to a chi-squared distribution with $k-1$ degrees of freedom when the sample size $n$ goes to infinity. In real applications, the number $k$ often changes with $n$ and may be even much larger than $n$. By using the martingale techniques, we prove that Pearson's chi-squared test statistic converges to the normal under quite general conditions. We also propose a new test statistic which is more powerful than chi-squared test statistic based on our simulation study. A real application to lottery data is provided to illustrate our methodology.
翻译:皮尔逊的“ 皮尔逊 ” 的“ 皮尔逊 ” 测试被广泛用于测试绝对数据与特定离散分布功能是否合得来。 当绝对数据数( 如$k$) 是一个固定整数时, 皮尔逊的“ 皮尔逊 ” 测试统计在样本大小为$0至无限时, 以“ 皮尔逊 ” 的“ 皮尔逊 ” 标准分布为“ 皮尔逊 ” 标准分布为“ 皮尔逊 ” 。 在实际应用中, 美元数经常以美元变化, 甚至可能大大超过 $0 。 通过使用马丁格莱 技术, 我们证明皮尔逊 的“ 皮尔逊 ” 奇夸度测试统计在相当一般的条件下与正常相融合。 我们还根据我们的模拟研究, 提出了一个比“ 皮尔逊 ” 测试数据更强大的新测试统计。 提供了对彩票数据的真正应用, 以说明我们的方法 。