AI算法连载04:数学基础之蒙特卡洛方法与MCMC采样

2019 年 8 月 15 日 算法与数学之美

相关文章:

AI算法连载01:数学基础之线性代数

AI算法连载02:概率论基础

AI算法连载03:数学基础之数值计算

导语: 不懂算法的工程师做不了AI,不懂算法的产品经理将把AI带入泥潭。



一、前言

在人工智能AI如火如荼的大潮下,越来越多的工程师们意识到算法是AI的核心。而面对落地的应用,不懂算法的AI产品经理将是空谈,不仅无法与工程师沟通,更无法深刻理解应用的性能与方式。所以业界逐渐形成一种共识:

不懂算法的工程师做不了AI,不懂算法的产品经理将把AI带入泥潭。


而其实,AI算法没有想象的那么难,为此,机器人网整理了一整套AI算法知识,包括:

从最基本的数学基础,譬如线性代数、概率论、牛顿法等数值计算、蒙特卡洛方法与MCMC采样等;

统计学,如:机器学习、向量、贝叶斯定理、决策树、梯度、模型评估、降维、聚类、边际、模型等等;

再到深度学习,如:前馈神经网络、反向传播算法、卷积升级网络、CNN图片分类、循环神经网络等等;

以及自然语言处理NLP等等;

还有AI算法中的各种工具和模型


我们将把这些AI基础理论和算法以连载的形式在机器人网公众号和网站上发布,供AI爱好者免费学习。

本次连载将历时一月有余,通过这一个月的学习,AI初学者也将可能跃变成AI大神,进入未来二十年科技的金字塔尖。

当然,这需要你的坚持、专注,和努力。感兴趣的同学可以关注我们,并加微信(Aspencore6)入群分享交流。


 

二、理论理解与数学基础

蒙特卡洛方法与MCMC采样


作为一种随机采样方法,马尔科夫链蒙特卡罗(Markov Chain Monte Carlo,以下简称MCMC)在机器学习,深度学习以及自然语言处理等领域都有广泛的应用,是很多复杂算法求解的基础。比如分解机(Factorization Machines)推荐算法,还有受限玻尔兹曼机(RBM)原理总结,都用到了MCMC来做一些复杂运算的近似求解。


从名字我们可以看出,MCMC由两个MC组成,即蒙特卡罗方法(Monte Carlo Simulation,简称MC)和马尔科夫链(Markov Chain ,也简称MC)。要弄懂MCMC的原理我们首先得搞清楚蒙特卡罗方法和马尔科夫链的原理。


蒙特卡罗原来是一个赌场的名称,用它作为名字大概是因为蒙特卡罗方法是一种随机模拟的方法,这很像赌博场里面的扔骰子的过程。最早的蒙特卡罗方法都是为了求解一些不太好求解的求和或者积分问题。


蒙特卡罗方法的关键是得到