The null hypothesis test (NHT) is widely used for validating scientific hypotheses but is actually highly criticized. Although Bayesian tests overcome several criticisms, some limits remain. We propose a Bayesian two-interval test (2IT) in which two hypotheses on an effect being present or absent are expressed as prespecified joint or disjoint intervals and their posterior probabilities are computed. The same formalism can be applied for superiority, non-inferiority, or equivalence tests. The 2IT was studied for three real examples and three sets of simulations (comparison of a proportion and a mean to a reference and comparison of two proportions). Several scenarios were created (with different sample sizes), and simulations were conducted to compute the probabilities of the parameter of interest being in the interval corresponding to either hypothesis given the data generated under one of the hypotheses. Posterior estimates were obtained using conjugacy with a low-informative prior. Bias was also estimated. The probability of accepting a hypothesis when that hypothesis is true progressively increases the sample size, tending towards 1, while the probability of accepting the other hypothesis is always very low (less than 5%) and tends towards 0. The speed of convergence varies with the gap between the hypotheses and with their width. In the case of a mean, the bias is low and rapidly becomes negligible. We propose a Bayesian test that follows a scientifically sound process, in which two interval hypotheses are explicitly used and tested. The proposed test has almost none of the limitations of the NHT and suggests new features, such as a rationale for serendipity or a justification for a "trend in data". The conceptual framework of the 2-IT also allows the calculation of a sample size and the use of sequential methods in numerous contexts.


翻译:无效假设测试(NHT)被广泛用于验证科学假设,但实际上却受到高度批评。虽然贝叶斯测试克服了几个批评,但仍有一些限制。我们提议进行巴伊西亚双对间测试(2IT),其中两个关于存在或不存在的影响的假设表现为预设的联合或脱节间隔,并计算出其前后的概率。对优越性、非推断性或等值测试也可以采用同样的形式论。2IT研究的是三个真实的间隔和三套模拟(比例的比较和参考和比较的平均值的比较,两个比例的比较,两个比例的参照和比较),但还存在一些限制。我们提出了几种假设(抽样大小不同),并进行了两个假设的模拟以计算利息参数的概率与假设中的某一间隔相对应,其中一个假设是联合或脱节,另一个假设的数值的概率是不同的,一个假设的概率是,另一个假设的数值是最低的,一个假设的概率是最低的,一个是最低的,一个假设的数值是最低的,一个假设的概率是最低的,一个是最低的,一个假设的概率是最低的,一个是最低的。一个假设的假设的概率的概率是不同的是不同的是,一个假设,一个假设的概率的概率的概率的概率,一个是不同的,一个是不同的是不同的,一个假设,一个是不同的是不同的,一个是不同的是,一个是不同的,一个是,一个假设的,一个是不同的是,一个是,一个是,一个假设的概率的概率的概率的概率的概率的概率的概率的概率的概率的概率的概率的。一个,一个是,一个是不同的是,一个是,一个是,一个是,一个是,一个是不同的是,一个是,一个是,一个是,一个是,一个是不同的,一个是不同的是不同的是不同的是不同的,一个是不同的是不同的是不同的是不同的是不同的。一个是,一个是不同的是不同的是不同的。一个是不同的。一个是,一个是,一个是,一个是,一个是,一个是,一个是,一个是,一个是,一个是,一个是,一个是,一个是,一个是,一个是,一个是,一个是,一个是,一个是,一个是,一个是,一个是,一个是,一个是,一个是,一个是,一个是,一个是

0
下载
关闭预览

相关内容

IJCAI2020接受论文列表,592篇论文pdf都在这了!
专知会员服务
63+阅读 · 2020年7月16日
【Google】平滑对抗训练,Smooth Adversarial Training
专知会员服务
46+阅读 · 2020年7月4日
因果图,Causal Graphs,52页ppt
专知会员服务
238+阅读 · 2020年4月19日
【哈佛大学商学院课程Fall 2019】机器学习可解释性
专知会员服务
98+阅读 · 2019年10月9日
Hierarchically Structured Meta-learning
CreateAMind
23+阅读 · 2019年5月22日
Transferring Knowledge across Learning Processes
CreateAMind
25+阅读 · 2019年5月18日
逆强化学习-学习人先验的动机
CreateAMind
15+阅读 · 2019年1月18日
强化学习的Unsupervised Meta-Learning
CreateAMind
17+阅读 · 2019年1月7日
Disentangled的假设的探讨
CreateAMind
9+阅读 · 2018年12月10日
disentangled-representation-papers
CreateAMind
26+阅读 · 2018年9月12日
【论文】变分推断(Variational inference)的总结
机器学习研究会
39+阅读 · 2017年11月16日
【计算机类】期刊专刊/国际会议截稿信息6条
Call4Papers
3+阅读 · 2017年10月13日
Adversarial Variational Bayes: Unifying VAE and GAN 代码
CreateAMind
7+阅读 · 2017年10月4日
Auto-Encoding GAN
CreateAMind
7+阅读 · 2017年8月4日
Inhomogeneous Markov Survival Regression Models
Arxiv
0+阅读 · 2021年9月7日
Arxiv
0+阅读 · 2021年9月6日
Arxiv
0+阅读 · 2021年9月5日
Arxiv
0+阅读 · 2021年9月3日
Arxiv
14+阅读 · 2020年12月17日
VIP会员
相关资讯
Hierarchically Structured Meta-learning
CreateAMind
23+阅读 · 2019年5月22日
Transferring Knowledge across Learning Processes
CreateAMind
25+阅读 · 2019年5月18日
逆强化学习-学习人先验的动机
CreateAMind
15+阅读 · 2019年1月18日
强化学习的Unsupervised Meta-Learning
CreateAMind
17+阅读 · 2019年1月7日
Disentangled的假设的探讨
CreateAMind
9+阅读 · 2018年12月10日
disentangled-representation-papers
CreateAMind
26+阅读 · 2018年9月12日
【论文】变分推断(Variational inference)的总结
机器学习研究会
39+阅读 · 2017年11月16日
【计算机类】期刊专刊/国际会议截稿信息6条
Call4Papers
3+阅读 · 2017年10月13日
Adversarial Variational Bayes: Unifying VAE and GAN 代码
CreateAMind
7+阅读 · 2017年10月4日
Auto-Encoding GAN
CreateAMind
7+阅读 · 2017年8月4日
Top
微信扫码咨询专知VIP会员