这是一本专门为计算机科学学生设计的数学概率和统计课程的教科书。计算机科学的例子在整个领域被使用,例如:计算机网络;数据和文本挖掘;计算机安全;遥感;计算机性能评价;软件工程;数据管理;等。
为什么这本书不同于所有其他关于数学概率和统计的书?
首先,它强烈强调直觉,较少数学形式主义。根据我的经验,通过样本空间定义概率(标准方法)是做好应用工作的主要障碍。将期望值定义为加权平均值也是如此。相反,我使用一种直观、非正式的方法,即长期频率和长期平均值。我相信这在解释条件概率和期望时特别有用,这些概念往往是学生们难以理解的。(他们通常认为自己理解了,直到他们实际上必须使用这些概念来解决一个问题。)另一方面,尽管相对缺乏形式主义,所有的模型等都被精确地用随机变量和分布来描述。这部分内容实际上比这一层次上的大部分内容都更具有数学意义因为它广泛地使用了线性代数。
第二,这本书强调了现实世界的应用。类似的课本,尤其是Mitzenmacher写的那本优雅有趣的计算机科学学生的书,侧重于概率,事实上是离散概率。他们预期的“应用”类别是算法的理论分析。相反,我关注的是这些材料在现实世界中的实际使用;它更倾向于连续而不是离散,更倾向于统计领域而不是概率。鉴于“大数据”和机器学习如今在计算机应用中发挥着重要作用,这一点应被证明尤其有价值。
第三,非常强调建模。相当多的重点放在这样的问题上:在现实生活中,概率模型的真正含义是什么?如何选择模型?我们如何评估模型的实用价值?这方面非常重要,因此有一个单独的章节,叫做模型构建导论。贯穿全文,有相当多的讨论的现实意义的概率概念。