贝叶斯统计是一种基于贝叶斯定理的数据分析方法,统计模型中有关参数的可用知识会随着观测数据中的信息而更新。背景知识以先验分布的形式表示,并以似然函数的形式与观测数据结合来确定后验分布。后验也可以用来预测未来的事件。这本入门书描述了贝叶斯分析中涉及的各个阶段,从指定先验模型和数据模型到推导推理、模型检查和细化。我们讨论了前验和后验预测检验、从后验分布中选择合适的抽样技术、变分推理和变量选择的重要性。本书提供了贝叶斯分析在不同研究领域的成功应用实例,包括社会科学、生态学、遗传学、医学等。我们提出了重现性和报告标准的策略,概述了一个更新的WAMBS(什么时候需要担心以及如何避免贝叶斯统计的误用)清单。最后,我们概述了贝叶斯分析对人工智能的影响,这是未来十年的主要目标。
贝叶斯统计是一种基于贝叶斯定理的数据分析和参数估计方法。贝叶斯统计的独特之处在于,统计模型中所有观察到的和未观察到的参数都给出了一个联合概率分布,称为先验分布和数据分布。典型的贝叶斯工作流包括三个主要步骤(图1):通过先验分布获取统计模型中给定参数的可用知识,这通常是在数据收集之前确定的;利用观测数据中可用参数的信息确定似然函数;并利用贝叶斯定理将先验分布和似然函数以后验分布的形式结合起来。后验分布反映了一个人的更新知识,平衡了先验知识和观测数据,并用来进行推理。贝叶斯推断是最优的,当在这个联合概率分布平均和推断这些量是基于他们的条件分布给出的观测数据。
这本入门书提供了贝叶斯统计的当前和未来使用的概述,适合在科学相关领域工作的定量研究人员,至少有一些回归建模的知识。我们提供了可以用于进一步研究的文献概述,并说明如何在真实数据上实现贝叶斯模型。所有的数据和代码都可以用于教学目的。这本入门书讨论了贝叶斯统计的一般框架,并介绍了贝叶斯研究框架(图1)。我们首先讨论了先验分布的形式化,先验预测检查和确定似然分布(实验)。讨论了相关算法和模型拟合,描述了变量选择和变分推理的实例,并给出了一个后验预测检验结果的实例计算。然后,我们描述贝叶斯统计如何被用于不同的科学领域(应用),遵循数据共享、再现性和报告标准的指导方针(再现性和数据沉积)。最后,我们讨论了如何避免使用不正确的模型(限制和优化)带来的偏差,并展望了贝叶斯人工智能(Outlook)的未来。
https://www.nature.com/articles/s43586-020-00001-2
专知便捷查看
便捷下载,请关注专知公众号(点击上方蓝色专知关注)
后台回复“BSM” 可以获取《【Nature】贝叶斯统计与建模综述,26页pdf》专知下载链接索引