数据科学概率导论

这本书是大学概率论的入门教材。它有一个使命: 阐明我们在科学和工程中使用的概率工具的动机、直觉和含义。从超过五年的课程教学中,我提炼出了我认为是概率方法的核心。我把这本书放在数据科学的背景下,以强调数据(计算)和概率(理论)在我们这个时代的不可分离性。

地址: https://probability4datascience.com/index.html

概率论是电子工程和计算机科学中最有趣的学科之一。它将我们喜爱的工程原理与现实联系起来,这是一个充满不确定性的世界。然而,因为概率是一门非常成熟的学科,单是本科生的课本就可能在图书馆的书架上摆满好几排书。当文学如此丰富时,挑战就变成了一个人如何在深入细节的同时洞察到洞察力。例如,你们中的许多人以前使用过正态随机变量,但你们是否想过“钟形”是从哪里来的?每一门概率课都会教你抛硬币,但是“抛硬币”在今天的机器学习中有什么用呢?数据科学家使用泊松随机变量来模拟互联网流量,但是这个漂亮的泊松方程是从哪里来的呢?这本书的目的是填补这些知识的差距,这是所有数据科学学生必不可少的。

这就引出了本书的三个目标。(i) 动机: 在数学定义、定理、方程的海洋中,为什么我们要把时间花在这个主题上,而不是其他的? (ii) 直觉: 当进行推导时,在这些方程之外是否有几何解释或物理学?(iii) 言外之意: 当我们学习了一个话题后,我们可以解决哪些新问题?本书的目标读者是电子工程和计算机科学专业的本科生三、四年级和一年级研究生。先决条件是标准的本科线性代数和微积分,除了需要傅里叶变换的特征函数部分。一门信号与系统的本科课程就足够了,即使是在学习这本书的同时选修。

这本书的篇幅适合两学期的课程。教师被鼓励使用最适合他们的课程的章节集。例如,基本概率课程可以使用第1-5章作为主干。关于样本统计的第6章适合希望获得概率收敛理论见解的学生。关于回归的第七章和关于估计的第八章最适合学习机器学习和信号处理的学生。第9章讨论了对现代数据分析至关重要的置信区间和假设检验。第10章介绍了随机过程。我的随机过程方法更适合于信息处理和通信系统,这通常与电气工程专业的学生更相关。

本书特色:

涵盖范围广,从经典的概率论到现代数据分析技术 概念的几何和图形解释 与MATLAB / Python紧密集成 机器学习的实际应用

目录内容

Chapter 1 Mathematical Background Chapter 2 Probability Chapter 3 Discrete Random Variables Chapter 4 Continuous Random Variables Chapter 5 Joint Distributions Chapter 6 Sample Statistics Chapter 7 Regression Chapter 8 Estimation Chapter 9 Confidence and Hypothesis Chapter 10 Random Processes

成为VIP会员查看完整内容
104

相关内容

数据科学(英語:data science)是一门利用数据学习知识的学科,其目标是通过从数据中提取出有价值的部分来生产数据产品。 它结合了诸多领域中的理论和技术,包括应用数学、统计、模式识别、机器学习、数据可视化、数据仓库以及高性能计算。 数据科学通过运用各种相关的数据来帮助非专业人士理解问题。
【纽约大学经典书】《机器学习基础》第二版,505页pdf
专知会员服务
136+阅读 · 2021年10月31日
专知会员服务
117+阅读 · 2021年10月6日
【经典书】高维概率数据科学应用导论,301页pdf
专知会员服务
87+阅读 · 2021年6月17日
【经典书】线性代数,352页pdf教你应该这样学
专知会员服务
105+阅读 · 2020年12月20日
专知会员服务
138+阅读 · 2020年12月3日
专知会员服务
124+阅读 · 2020年11月25日
【经典书】概率统计导论第五版,730页pdf
专知会员服务
237+阅读 · 2020年7月28日
【资源】这本开放书籍帮你扫清通往ML的数学绊脚石
机器学习算法与Python学习
56+阅读 · 2018年10月28日
如何用 3 个月零基础入门机器学习?
AI研习社
6+阅读 · 2017年9月27日
CIIA:A New Algorithm for Community Detection
Arxiv
0+阅读 · 2021年10月28日
Arxiv
6+阅读 · 2021年7月26日
Arxiv
49+阅读 · 2021年5月9日
Arxiv
22+阅读 · 2019年11月24日
Arxiv
26+阅读 · 2018年8月19日
Arxiv
3+阅读 · 2018年2月22日
Arxiv
5+阅读 · 2018年1月14日
VIP会员
相关VIP内容
【纽约大学经典书】《机器学习基础》第二版,505页pdf
专知会员服务
136+阅读 · 2021年10月31日
专知会员服务
117+阅读 · 2021年10月6日
【经典书】高维概率数据科学应用导论,301页pdf
专知会员服务
87+阅读 · 2021年6月17日
【经典书】线性代数,352页pdf教你应该这样学
专知会员服务
105+阅读 · 2020年12月20日
专知会员服务
138+阅读 · 2020年12月3日
专知会员服务
124+阅读 · 2020年11月25日
【经典书】概率统计导论第五版,730页pdf
专知会员服务
237+阅读 · 2020年7月28日
相关论文
CIIA:A New Algorithm for Community Detection
Arxiv
0+阅读 · 2021年10月28日
Arxiv
6+阅读 · 2021年7月26日
Arxiv
49+阅读 · 2021年5月9日
Arxiv
22+阅读 · 2019年11月24日
Arxiv
26+阅读 · 2018年8月19日
Arxiv
3+阅读 · 2018年2月22日
Arxiv
5+阅读 · 2018年1月14日
微信扫码咨询专知VIP会员