这个备受期待的第二版包含新的章节和新内容,225个新参考文献以及全面的R软件。与上一版保持一致,这本书涉及数据分析和预测建模相关的知识,需要选择和使用多种工具。本书没有介绍孤立的技术,而是强调解决问题的策略,这些策略解决了使用实际数据而不是标准教科书示例开发多变量模型时出现的许多问题。它包括用于有效处理缺失数据的插补方法,用于拟合非线性关系并使转换估计成为建模过程正式形式的方法,用于处理“要分析的变量太多而观察不到的方法” 以及基于引导程序的强大模型验证技术。读者将对预测的准确性以及对连续的预测因素或结果进行分类的危害有敏锐的理解。本书实际处理模型不确定性及其对推理的影响,以实现“安全数据挖掘”。它还提供了许多图形方法,用于将复杂的回归模型传达给非统计人员。
![](https://cdn.zhuanzhi.ai/vfiles/44b832ebf4caf72fb9d4d8f60dff6f01)
回归建模策略提供了非平凡数据集的全面案例研究,而不是每种方法的过度简化说明。这些案例研究使用免费提供的R函数,这些函数使书中所述的多重插补,模型构建,验证和解释任务相对容易实现。本书中的大多数方法都适用于所有回归模型,但是要特别强调使用广义最小二乘用于纵向数据,二进制逻辑模型,序数响应模型,参数生存回归模型和Cox半参数生存模型的多元回归。。新的重点是使用序数回归对连续因变量进行稳健分析。
如在第一版中,该文本适用于硕士或博士学位。拥有一般概论和统计课程的高水平研究生,并且精通普通的多元回归和中级代数。该书还将包含有关现代统计建模技术的最新调查和参考书目,可供数据分析人员和统计方法学家参考。本书中使用的示例主要来自生物医学研究,但是该方法适用于任何有用的预测模型(“分析”),包括经济学,流行病学,社会学,心理学,工程学和市场营销。