许多人觉得统计分析令人费解。为什么? 因为它需要新的思维方式。你又如何理解这些新的思维方式呢? 为了正确理解统计分析,你需要理解它的一些关键基础。阅读教科书是行不通的,因为教科书没有关注基础,而且它们涵盖了太多的内容和细节,读者必然会只见树木不见森林。我有很多方法来补救这种状况。我做的第一件事是关注一个每个人都应该熟悉的应用领域。第二,我关注最直接的调研问题和回答——你同意还是不同意?你赞成还是不赞成?我所做的第三件事是关注那些对于理解统计分析的本质和对结果的解释至关重要的基础,无论是民意调研结果还是药物试验结果。第四,我用了很多插图。即使你以前学过统计学课程,即使你知道执行统计分析的机制,你也会从这些基础中受益。
统计值的抽样分布是一切的关键。这就是为什么封面上有抽样分布的插图,这本书中也有抽样分布的插图。
我们从字面上和比喻上画的线定义了一个区间,用来决定一个假设是否应该被拒绝。你可以在封面上看到两条间隔线,叠加在抽样分布上。
两个关键方面——方差样本大小——决定了抽样分布的形状和区间的宽度。我们将看到这些东西是如何相互作用的。
有了抽样分布和置信区间,我们可以对核心内容进行统计分析。但在解释结果时,我们确实需要小心。
某些假设可以被接受,但另一些假设只能被拒绝。这两者之间有一个微妙但重要的区别。
统计显著性的意义是有限的,它并不意味着存在有意义的现实世界的影响。
我们会犯一些我们不知道自己犯过的错误,可能永远也不会知道。但我们可以试着限制它们可能发生的频率。
减少一种错误的可能性会增加另一种错误的可能性。我们可以减少两者的可能性,但那需要额外的费用。
当我们使用统计分析方法而不满足其假设时,奇怪的事情发生了。