随机变量 - 统计学核心方法及其应用

2018 年 12 月 18 日 遇见数学


理论与数值计算相结合

涵盖理解和运用参数统计方法所需核心知识
为数据分析构建新方法

下文节选自《统计学核心方法及其应用》, 已获人邮图灵授权许可, [遇见数学] 特此表示感谢!


1.1 随机变量概述
统计学的本质是从具有不可预测性的数据中提取信息,随机变量则是为这种可变性建立模型的数学工具. 在每一次观测中,随机变量随机取不同的值. 我们无法提前预测随机变量的精确取值,但是可以对可能的取值做出概率性的刻画. 也就是说,我们可以描述随机变量的取值的分布. 本章简要回顾应用随机变量时所涉及的专业知识,以及一些常用的结果. 详细论述见参考文献 [8]、[19].

1.2 累积分布函数
随机变量(r.v. 的累积分布函数(c.d.f.)是满足下式的函数  :

 给出了  的取值小于或等于  的概率. 显然 并且  是单调函数. 该定义的一个有用的结论是,如果  是连续函数,那么  在 [0, 1] 上呈均匀分布:它取 0 和 1 之间任意值的概率是相等的. 这是因为

(如果  是连续函数),那么后者是 [0, 1] 上的均匀随机变量的累积分布函数.

定义累积分布函数的反函数为 . 当  为连续函数时 正是  在一般意义下的反函数.  通常叫作  的分位函数. 如果  在[0, 1] 上呈均匀分布,那么  的分布就是  的累积分布函数  . 对于可计算的  ,在给定均匀随机偏差的产生方式的前提下,上述定义给出了任意分布下的随机变量的生成方法.

令  为 0 和 1 之间的一个数.  的  分位数是一个数值 小于或等于该值的概率是 即 . 分位数有广泛的应用,其中一个应用是验证  是否是累积分布函数为  的随机变量的观测值. 将  按顺序排列,把它们作为“观测分位数”. 这些点和理论上的分位点 共同绘制的图叫作分位数—分位数图(QQ 图). 如果观测值来自于累积分布函数为  的分布, 那么得到的 QQ 图应该接近直线.

[遇见]小编推荐观看《视频 | QQ分位图的解释及画法



1.3 概率函数与概率密度函数
在很多统计学方法中,描述随机变量取某个特定值的概率的函数比累积分布函数更有用. 为了探讨这类函数,首先需要区分取离散值(例如非负整数)的随机变量和取值为实数轴上的区间的随机变量.

对于离散型随机变量 概率函数(又叫概率质量函数 是满足下式的函数:

显然,0并且因为  的取值一定存在,所以对  的所有可能取值(记为 求和可得 .


对于连续型随机变量 因为它所有可能的取值有无限个,所以取任意特定值的概率一般是 0,因此,概率函数对连续型随机变量不适用. 取而代之的是概率密度函数 它给出了  在  附近的单位区间内取值的概率,即 . 更加正式的定义是,对任意常数 


显然 必须满足  且 . 注意,  ,因此如果  存在,那么 . 附录 A 给出了一些常用的标准分布的概率函数或概率密度函数.

除特别注明外,后续几节主要考虑连续型随机变量,用适当的求和代替积分, 可以得到等价的对离散型随机变量适用的结果. 为了简洁起见,约定当自变量不同时,概率密度函数不同(例如 和  表示不同的概率密度函数).

向上滑动阅三部套装简介, 购书链接

信息爆炸的大数据时代,统计越显重要,统计学亦已成为现代科学的重要工具之一,被广泛应用于各门学科之中,从自然科学到人文社会科学,甚至是工商业及政府的情报决策。在理性的基础上,所有的判断都源于统计学。

本书是英国巴斯大学统计学教授、R包mgcy作者西蒙•N.伍德为具有数理基础的读者精心撰写的统计学参考书,涵盖理解和运用参数统计方法所需的核心知识,为数据分析构建新的方法。主要内容如下。

●基本概率理论
●如何用极大似然法和贝叶斯方法解决统计模型和统计推断中的问题
●R语言概述
●极大似然估计的大样本理论及其应用
●贝叶斯计算所需的数值方法
●线性模型理论及其应用

前言    阅读    

第1章 随机变量    阅读    

第2章 统计模型与统计推断    

第3章 R    

第4章 极大似然估计理论    

第5章 数值极大似然估计    

第6章 贝叶斯计算    

第7章 线性模型    

附录 A 一些分布    

附录 B 矩阵运算    

附录 C 随机数生成    



1.4 随机向量
从单次观测中很难得到有用的信息. 有效的统计分析需要多重观测和同时处理多元随机变量的能力. 因此,我们需要概率密度函数的多元形式. 二维的情形能够充分阐释所需的概念,因此考虑随机变量  和  .


设  是  平面上的任意区域 和  的联合概率密度函数  是满足下式的函数:

因此 在  的取值是  平面上单位面积的概率. 设  是包含点  的面积为  的小区域,那么 . 同单变量的概率密度函数一样 是非负的,并且在  上的积分值为 1.

例图1-1 给出了下式中的联合概率密度函数的图像.


该概率密度函数下的两个概率值的估计如图1-2所示.


1.4.1 边缘分布
继续沿用  和  的例子,忽略其中一个变量 或  的概率密度函数可以通过  来计算. 在给定  的条件下 的概率密度就是  的边缘概率密度函数. 由概率密度函数的定义显然可以得到

 的定义同理.

1.4.2条件分布
假设已知  取定值 那么关于  的分布,我们有什么结论?因为  和 的联合概率密度函数是 所以在给定  的条件下,我们预计x的密度与  成正比,即

其中  是常数.如果  是一个概率密度函数,那么它一定能够取到积分值 1. 因此

其中  表示  取  时的边缘密度.因此我们有:

定义 如果  和  的联合概率密度函数是 那么在  的条件下 的条件密度是

 (1.3)

假设 .

注意,当  取定值  时,这是随机变量  的概率密度函数.在意义明确的前提下,为了简洁起见,可以用  代替 . 显然,在给定  时,  的条件分布有类似的定义: . 联合概率密度函数和条件概率密度函数之间的关系如图1-3所示.

在统计学中,常常利用  将联合概率密度替换为条件概率密度,但当维数超过 2 时,结论不能直接推广.以下是 3 个较为常用的例子.

1.4.3 贝叶斯定理
从上一小节可知 
重组上式的后两项可以得到

 


这个重要的结论叫作贝叶斯定理,在该定理的基础上形成了一个完整的统计学模型体系,见第 2 章和第 6 章. (1.1~1.4节完)

登录查看更多
0

相关内容

【2020新书】监督机器学习,156页pdf,剑桥大学出版社
专知会员服务
151+阅读 · 2020年6月27日
【经典书】机器学习:贝叶斯和优化方法,1075页pdf
专知会员服务
404+阅读 · 2020年6月8日
【新书册】贝叶斯神经网络,41页pdf
专知会员服务
177+阅读 · 2020年6月3日
自回归模型:PixelCNN
专知会员服务
26+阅读 · 2020年3月21日
一文读懂线性回归、岭回归和Lasso回归
CSDN
34+阅读 · 2019年10月13日
【机器学习】深入剖析机器学习中的统计思想
产业智能官
14+阅读 · 2019年1月24日
稀疏性的3个优势 -《稀疏统计学习及其应用》
遇见数学
15+阅读 · 2018年10月24日
零基础概率论入门:最大似然估计
论智
12+阅读 · 2018年1月18日
概率论之概念解析:引言篇
专知
6+阅读 · 2018年1月8日
概率论之概念解析:极大似然估计
专知
9+阅读 · 2018年1月6日
蒙特卡罗方法入门
算法与数学之美
7+阅读 · 2017年9月26日
Phase-aware Speech Enhancement with Deep Complex U-Net
Arxiv
3+阅读 · 2018年10月11日
Arxiv
23+阅读 · 2018年8月3日
Arxiv
7+阅读 · 2018年3月21日
Arxiv
5+阅读 · 2018年1月16日
Arxiv
3+阅读 · 2018年1月10日
VIP会员
相关资讯
一文读懂线性回归、岭回归和Lasso回归
CSDN
34+阅读 · 2019年10月13日
【机器学习】深入剖析机器学习中的统计思想
产业智能官
14+阅读 · 2019年1月24日
稀疏性的3个优势 -《稀疏统计学习及其应用》
遇见数学
15+阅读 · 2018年10月24日
零基础概率论入门:最大似然估计
论智
12+阅读 · 2018年1月18日
概率论之概念解析:引言篇
专知
6+阅读 · 2018年1月8日
概率论之概念解析:极大似然估计
专知
9+阅读 · 2018年1月6日
蒙特卡罗方法入门
算法与数学之美
7+阅读 · 2017年9月26日
Top
微信扫码咨询专知VIP会员