We consider the identity testing problem - or goodness-of-fit testing problem - in multivariate binomial families, multivariate Poisson families and multinomial distributions. Given a known distribution $p$ and $n$ iid samples drawn from an unknown distribution $q$, we investigate how large $\rho>0$ should be to distinguish, with high probability, the case $p=q$ from the case $d(p,q) \geq \rho $, where $d$ denotes a specific distance over probability distributions. We answer this question in the case of a family of different distances: $d(p,q) = \|p-q\|_t$ for $t \in [1,2]$ where $\|\cdot\|_t$ is the entrywise $\ell_t$ norm. Besides being locally minimax-optimal - i.e. characterizing the detection threshold in dependence of the known matrix $p$ - our tests have simple expressions and are easily implementable.
翻译:我们认为,在多变二元家庭、多变 Poisson 家庭和多子分布中,身份测试问题(或最佳测试问题)是多变的二元家庭、多变的 Poisson 家庭和多子分布中。鉴于已知的分发量为美元和美元美元,我们调查从未知分配量中提取的样本[1,2]美元,如果美元是入点值为美元/美元/美元/美元/美元标准,那么该大宗案例(美元/美元/美元/美元/美元)与案件(美元/美元/美元/美元/美元)/美元(美元)/美元/美元/美元,其中美元表示概率分布的具体距离。我们回答这个问题的是不同距离的家庭:美元(p,q)= 美元/美元/美元/美元/美元(美元/美元/美元/美元/美元/美元/美元/美元/美元/美元/美元/美元/美元/美元/美元/美元/美元/美元/美元/美元/美元/美元/美元/美元/美元/美元/美元/美元/美元/美元/美元/美元/美元/美元/美元/美元/美元/美元/美元/美元/美元/美元/美元/美元/美元/美元/美元/美元/美元/美元/美元/美元/美元/美元/美元/美元/美元/美元/美元/美元/美元/美元/美元/美元/美元/美元/美元/美元/美元/美元/美元/美元/美元/美元/美元/美元/美元/美元/美元/美元/美元/美元/美元/美元/美元/美元/美元/美元/美元/美元/美元/美元/美元/美元/美元/美元/美元/美元/美元/美元/美元/美元/美元/美元/美元/美元/美元/美元/美元/美元/美元/美元/美元/美元/美元/美元/美元/美元/美元/美元/美元/美元/美元/美元/美元/美元/美元/美元/美元/美元/美元/美元/美元/美元/美元/美元/美元/美元/美元/美元/美元/美元/美元/美元/美元/美元/美元/美元/美元/美元/美元/美元/美元/美元/美元/美元/美元/美元/美元/美元/美元/美元/美元/美元/美元/美元/美元/美元/美元/