作者
介绍
louwill,忠实R粉,数据科学爱好者。
个人公众号:数据科学家养成记
话说自从接触数据分析以来,就不断在各种文献和大牛的文章里看到马尔科夫链这种东西。对于像小编这种经管出身、半路出家的数据爱好者而言,老是让这种一头雾水的名词出现在自己眼前又无可奈何的样子,真是忍无可忍。于是,在今天这样一个好日子里,我们就好好的来怼一怼这个传说的马尔科夫链。
本来想闲话短说,但好像要把马尔科夫链这种东西说清楚还不得不提随机过程这门课。广大理工科的同学一定知道,所谓随机过程,它其实就是一个过程,就好像今天勇士队输了,那她下场会不会赢呢?下场不赢那下下场呢?以及我们怎么预测勇士队下场赢还是输呢?随机过程就是这样一个工具,它通过各种定量的分析和数理统计的公式推导来预测勇士队下场比赛会不会赢。
所以,你可能猜出来了,马尔科夫链就是一种随机过程,那它到底是哪种随机过程呢?小编也说不清楚,我们就拿小编每天下午五点钟的状态来举个实例吧。
话说在读研的小编每天在学校日子充盈,每天不是在搞数据分析就是在看数据分析,小编每天下午五点钟只有三种状态:在实验室搞数据(学习)、在和女朋友去食堂的路上(陪女友)以及在篮球场打球(打球)。
现在你们是知道小编每天下午五点钟的状态了。那你们想知道小编N天后的某个下午五点在干嘛吗?知道你们不想,就假装很想知道的样子就好。
现在我们来做个假设,小编每个五点钟状态之间的转移都是有一定的概率支撑的。比如说,小编今天下午五点钟在篮球场打球,那明天陪女友的概率是多少呢?或者明天在学习的概率有多少呢?或者明天下午五点还在球场打球的概率是多少呢?小编手画个图,更直观一点:
小编图中画的那个概率矩阵就是传说中的状态转移矩阵,我们把它命名为P。并且这个P是保持不变的,也就是说小编今天的到明天的状态转移矩阵和明天到后天的状态转移矩阵是一样的。有了这个矩阵之后,你们就可以推算出N天后小编下午五点的状态分布了。
今天是6月10号,11号的状态矩阵可以通过P1*P计算得到(不会矩阵乘法的自己去找线性代数看哈),12号的状态矩阵可以通过P2*P得到,以此类推,可见马尔科夫链的状态分布只和当前状态有关,而和之前的状态无关!
所以,这就是小编对于马尔科夫链的简单解释,应该都能让大家看懂吧。至于隐马尔科夫模型、马尔科夫链蒙特卡洛(小编的毕业设计)这些内容,听起来就怕人,这里就不说啦!
公众号后台回复关键字即可学习
回复 R R语言快速入门及数据挖掘
回复 Kaggle案例 Kaggle十大案例精讲(连载中)
回复 文本挖掘 手把手教你做文本挖掘
回复 可视化 R语言可视化在商务场景中的应用
回复 大数据 大数据系列免费视频教程
回复 量化投资 张丹教你如何用R语言量化投资
回复 用户画像 京东大数据,揭秘用户画像
回复 数据挖掘 常用数据挖掘算法原理解释与应用
回复 机器学习 人工智能系列之机器学习与实践
回复 爬虫 R语言爬虫实战案例分享