编者按:Towards Data Science博主Devin Soni通过简单的例子简明扼要地介绍了期望值这一概念。
期望值是大量试验之后随机变量的平均值。随机变量将数值映射到试验的每个可能的结果。我们可以计算离散随机变量的期望值——潜在的结果数目是可数的——每项是一个随机变量的可能值,乘以该结果的概率,最后累加。例如,如果我们的随机变量是投掷一个均匀的3面骰所得的数字,那么期望值将是(1 * 1/3) + (2 * 1/3) + (3 * 1/3) = 2
。
如果我们假设试验是一个游戏,那么随机变量映射游戏结果至收益,因而期望值表示期望的游戏平均收益。由于期望值是实数,它通常分为负值、中性值、正值。在日常生活场景中,期望值为负、期望值为中性、期望值为正的游戏都很常见,所以期望值提供了一个简单的决策推断法。
下面我将举例说明每种类型的游戏,我会使用3个类似的扔硬币的例子,具体来说,每个场景中的随机变量将是扔一次硬币后的期望收益。假设所有情形下硬币是均质的,所以得到正面和反面的概率是一样的(1/2)。
你扔一枚均质硬币。每次扔到正面,你损失1美元,每次扔到反面,你获得1美元。
这一场景下的期望值为(-1 * 1/2) + (1 * 1/2) = 0
。因此,由于硬币是均质的,损失和收益相等,随着时间的推移,你可以期望既不赢钱也不输钱。在这样的游戏中,尽管没有理由进行这一游戏,也没有理由不进行。因此,这类游戏是一种理想的简单娱乐形式,比如剪刀石头布,随机选择是期望值为0的最优策略。
你扔一枚均质硬币。每次扔到正面,你损失1美元,每次扔到反面,你获得2美元。
这一场景下的期望值为(-1 * 1/2) + (2 * 1/2) = 1/2
。由于正面和反面出现的概率一样,扔到反面时较大的收益超过了扔到正面时的损失。在这样的游戏中,随着时间的推移,你可以期望得到更多的钱,所以你应该玩这类游戏。这类场景出现在许多现实生活的决策中,例如投资股票市场(总体而言,随着时间的推移,市场的走势是向上的),为考试而学习(更高的GPA收益超过了损失的一些时间),准备面试(得到更好的工作的收益超过了损失的几周时间)。
你扔一枚均质硬币。每次扔到正面,你损失1美元,每次扔到反面,你获得1美元。此外,不管结果如何,每扔一次硬币,你都需要支付1美分的费用。
这一场景下的期望值为(-1.01 * 1/2) + (.99 * 1/2) = -0.01
。因此,尽管硬币本身是均质的,损失数额也等于收益数额,恒定的费用导致这一游戏变为负值游戏。在这样的游戏中,你可以期望随着时间的推移而亏钱。所以你不应该玩这类游戏。这在很多赌博平台上很常见,赌场提供初始为中性的游戏,但通过收费破坏了游戏的中性(俗话说:“赌场只赚不赔。”)。
基于期望值进行决策是一个判定参与某项活动是否在经济学上合理的简单方式。当然,除了纯粹的经济回报,还有其他衡量可用性的方式,所以期望为正并不是一个傻瓜式的决策工具。此外,别忘了期望值需要大量重复的试验才能起效,因此对于特定事件(其中的一些概率极其罕见)而言,期望值可能提供了扭曲的视角。例如,考虑彩票得奖。尽管彩票有可能有机会是正期望值(译者注:比如由于前面好几期无人得头奖,奖池累积金额很高,国内福利彩票奖池设有上限,期望值不可能为正),但你在你有限的人生中实际实现这一期望值的概率极低,所以买彩票并不值。
原文地址:https://towardsdatascience.com/what-is-expected-value-4815bdbd84de