INTRODUCTION: Wald's, the likelihood ratio (LR) and Rao's score tests and their corresponding confidence intervals (CIs), are the three most common estimators of parameters of Generalized Linear Models. On finite samples, these estimators are biased. The objective of this work is to analyze the coverage errors of the CI estimators in small samples for the log-Poisson model (i.e. estimation of incidence rate ratio) with innovative evaluation criteria, taking in account the overestimation/underestimation unbalance of coverage errors and the variable inclusion rate and follow-up in epidemiological studies. METHODS: Exact calculations equivalent to Monte Carlo simulations with an infinite number of simulations have been used. Underestimation errors (due to the upper bound of the CI) and overestimation coverage errors (due to the lower bound of the CI) have been split. The level of confidence has been analyzed from $0.95$ to $1-10^{-6}$, allowing the interpretation of P-values below $10^{-6}$ for hypothesis tests. RESULTS: The LR bias was small (actual coverage errors less than 1.5 times the nominal errors) when the expected number of events in both groups was above 1, even when unbalanced (e.g. 10 events in one group vs 1 in the other). For 95% CI, Wald's and the Score estimators showed high bias even when the number of events was large ($\geq 20$ in both groups) when groups were unbalanced. For small P-values ($<10^{-6}$), the LR kept acceptable bias while Wald's and the score P-values had severely inflated errors ($\times 100$). CONCLUSION: The LR test and LR CI should be used.


翻译:Wald's, 可能性比率 (LR) 和 Rao的分数测试及其相应的信任度(CIs) 是通用线性模型参数的三个最常见的估计值。 在有限的样本中, 这些估计值是有偏差的。 这项工作的目的是分析日志- Poisson 模型小样本中 CIS 估计值的覆盖范围错误( 估计发生率) 的创新评价标准, 同时考虑到高估/ 低估率差错以及流行病学研究的可变包容率和后续性。 方法S: 与模拟次数无限的 Monte Carlo 模拟相当的精确计算。 低估错误( 由于 CIS 的上限) 和高估覆盖率错误( 由于 CIS 的下限) 。 信任度水平已经从0. 95美元到 10 6美元分析, 将P- 6 值小于 10 6 美元的解释值进行假设测试。 甚至 RESLTOS: 一次模拟的精确度计算值计算为1.5倍, 而标准值为10 数值组的数值为1.5 。 在10 的数值组中, 的数值为10 的数值为10 的数值为10, 的数值为10 的数值为10 的数值显示的数值为10 的数值为10 的数值为10 的数值为10 的数值为10 的数值为10 的数值为10 的数值为10 的数值为10 的数值为10 的数值为10 的数值为10 的数值为10 的数值为10 的数值为10 的数值为10 的数值为10 的数值为10 的数值为10 的数值为10 的数值为10 的数值为10 的数值为10 的数值为, 。 。 的数值为, 的数值为数值为, 的数值为为为为, 的数值为的数值为的数值为, 。 。 。 的数值为 。 的数值为 的数值为 的数值为10 的数值为10 的数值为10 的数值为10 的数值为 的数值为, 的数值为 的数值为 的数值为10 的数值为10 的数值为10 的数值为10 的数值为10 的数值

0
下载
关闭预览

相关内容

专知会员服务
50+阅读 · 2020年12月14日
【干货书】机器学习速查手册,135页pdf
专知会员服务
125+阅读 · 2020年11月20日
手写实现李航《统计学习方法》书中全部算法
专知会员服务
48+阅读 · 2020年8月2日
Linux导论,Introduction to Linux,96页ppt
专知会员服务
77+阅读 · 2020年7月26日
【新书】贝叶斯网络进展与新应用,附全书下载
专知会员服务
119+阅读 · 2019年12月9日
机器学习入门的经验与建议
专知会员服务
92+阅读 · 2019年10月10日
sklearn 与分类算法
人工智能头条
7+阅读 · 2019年3月12日
已删除
将门创投
3+阅读 · 2019年1月8日
Bias in Zipf's Law Estimators
Arxiv
0+阅读 · 2021年5月12日
Arxiv
0+阅读 · 2021年5月4日
VIP会员
相关VIP内容
专知会员服务
50+阅读 · 2020年12月14日
【干货书】机器学习速查手册,135页pdf
专知会员服务
125+阅读 · 2020年11月20日
手写实现李航《统计学习方法》书中全部算法
专知会员服务
48+阅读 · 2020年8月2日
Linux导论,Introduction to Linux,96页ppt
专知会员服务
77+阅读 · 2020年7月26日
【新书】贝叶斯网络进展与新应用,附全书下载
专知会员服务
119+阅读 · 2019年12月9日
机器学习入门的经验与建议
专知会员服务
92+阅读 · 2019年10月10日
相关资讯
sklearn 与分类算法
人工智能头条
7+阅读 · 2019年3月12日
已删除
将门创投
3+阅读 · 2019年1月8日
Top
微信扫码咨询专知VIP会员