【导读】加州大学伯克利分校统计系及电气工程与计算机科学系校长教授郁彬发表了最新论文《真实数据科学,Veridical data science》。
可预测性、可计算性和稳定性(PCS)是数据科学的三个核心原则。它们将预测和复制的科学原理嵌入到数据驱动的决策中,同时认识到计算的中心作用。基于这些原则,我们提出了PCS框架,包括工作流程和文档(在R Markdown或Jupyter Notebook中)。PCS框架旨在跨科学、社会科学、工程、商业和政府领域的负责任的、可靠的、可复制的和透明的分析。它可以作为科学假设生成和实验设计的推荐系统。特别地,我们建议(基本)PCS推论用于数据结果的可靠性度量,将统计推论扩展到当前数据科学实践需要的更广泛的范围。