马尔科夫链蒙特卡洛方法(Markov Chain Monte Carlo),简称MCMC,产生于19世纪50年代早期,是在贝叶斯理论框架下,通过计算机进行模拟的蒙特卡洛方法(Monte Carlo)。该方法将马尔科夫(Markov)过程引入到Monte Carlo模拟中,实现抽样分布随模拟的进行而改变的动态模拟,弥补了传统的蒙特卡罗积分只能静态模拟的缺陷。MCMC是一种简单有效的计算方法,在很多领域到广泛的应用,如统计物、贝叶斯(Bayes)问题、计算机问题等。
没有模型如何进行强化学习——蒙特卡洛方法
机器人学家
2+阅读 · 2017年2月21日
海森堡模型的谱,到底有多靠谱
中国物理学会期刊网
1+阅读 · 2018年1月15日
比AlphaGo Zero更强的AlphaZero来了!8小时解决一切棋类!
炼数成金订阅号
1+阅读 · 2017年12月7日
一张分子结的周期表
中国物理学会期刊网
0+阅读 · 2018年8月6日
战略|LP选择GP的赛马逻辑:赛道,骑手和赛马
智慧云董事会
1+阅读 · 2018年5月22日
随机梯度蒙特卡洛算法-重要性采样|NeurIPS 2020
极市平台
0+阅读 · 2020年10月29日
【论文深度研读报告】MuZero算法过程详解
深度强化学习实验室
2+阅读 · 2021年1月18日
微信扫码咨询专知VIP会员