The Markov-Chain Monte-Carlo (MCMC) method has been used widely in the literature for various applications, in particular estimating the expectation $\mathbb{E}_{\pi}[f]$ of a function $f:\Omega\to [a,b]$ over a distribution $\pi$ on $\Omega$ (a.k.a. mean-estimation), to within $\varepsilon$ additive error (w.h.p.). Letting $R \doteq b-a$, standard variance-agnostic MCMC mean-estimators run the chain for $\tilde{\cal O}(\frac{TR^{2}}{\varepsilon^{2}})$ steps, when given as input an (often loose) upper-bound $T$ on the relaxation time $\tau_{\rm rel}$. When an upper-bound $V$ on the stationary variance $v_{\pi} \doteq \mathbb{V}_{\pi}[f]$ is known, $\tilde{\cal O}\bigl(\frac{TR}{\varepsilon}+\frac{TV}{\varepsilon^{2}}\bigr)$ steps suffice. We introduce the DYNAmic {Mcmc} Inter-Trace variance Estimation (DynaMITE) algorithm for mean-estimation. We define the inter-trace variance $v_{T}$ for any trace length $T$, and show that w.h.p., DynaMITE estimates the mean within $\varepsilon$ additive error within $\tilde{\cal O}\bigl(\frac{TR}{\varepsilon} + \frac{\tau_{\rm rel} v_{\tau\rm rel}}{\varepsilon^{2}}\bigr)$ steps, without {a priori} bounds on $v_{\pi}$, the variance of $f$, or the trace variance $v_{T}$. When $\epsilon$ is small, the dominating term is $\tau_{\rm rel} v_{\tau\rm rel}$, thus the complexity of DynaMITE principally depends on the {\it a priori unknown} $\tau_{\rm rel}$ and $v_{\tau\rm rel}$. We believe in many situations $v_{T}=o(v_{\pi})$, and we identify two cases to demonstrate it. Furthermore, it always holds that $v_{\tau\rm rel} \leq 2v_{\pi}$, thus the worst-case complexity of DynaMITE is $\tilde{\cal O}(\frac{TR}{\varepsilon} +\frac{\tau_{\rm rel} v_{\pi}}{\varepsilon^{2}})$, improving the dependence of classical methods on the loose bounds $T$ and $V$.


翻译:Markov- Chain Monte-Carlo (MC) 方法在文献中被广泛用于各种应用, 特别是估算一个函数$:\\ mega\ to [a,b]$的分配美元(a.k.a. 平均估计), 以美元为单位, 以美元为单位, 以美元为单位, 以美元为单位( wh. p.) 的添加性错误( wh. h.) 。 任 R\ doteq b- a 美元, 标准差异- 变异 MC 平均值(美元) 以美元为单位(美元) 美元为单位, 以美元为单位(美元) 以美元为单位, 以美元为单位(美元) 以美元为单位, 以美元为单位(美元) 以美元为单位(美元为单位, 以美元为单位(美元) 以美元为单位(美元) 以美元为单位, 以美元为单位(美元) 以美元为单位(美元) 以美元为单位( 以美元为单位(美元) 以美元为单位(美元) 以美元为单位(美元为单位(美元) 以内) 以美元为单位(美元) 以美元为单位(美元) 以内) 以美元为单位(美元为单位(美元)

0
下载
关闭预览

相关内容

专知会员服务
53+阅读 · 2020年9月7日
Linux导论,Introduction to Linux,96页ppt
专知会员服务
79+阅读 · 2020年7月26日
Fariz Darari简明《博弈论Game Theory》介绍,35页ppt
专知会员服务
111+阅读 · 2020年5月15日
Python分布式计算,171页pdf,Distributed Computing with Python
专知会员服务
108+阅读 · 2020年5月3日
《DeepGCNs: Making GCNs Go as Deep as CNNs》
专知会员服务
31+阅读 · 2019年10月17日
强化学习最新教程,17页pdf
专知会员服务
177+阅读 · 2019年10月11日
计算机 | 入门级EI会议ICVRIS 2019诚邀稿件
Call4Papers
10+阅读 · 2019年6月24日
逆强化学习-学习人先验的动机
CreateAMind
16+阅读 · 2019年1月18日
强化学习的Unsupervised Meta-Learning
CreateAMind
17+阅读 · 2019年1月7日
Disentangled的假设的探讨
CreateAMind
9+阅读 · 2018年12月10日
Hierarchical Disentangled Representations
CreateAMind
4+阅读 · 2018年4月15日
计算机视觉近一年进展综述
机器学习研究会
9+阅读 · 2017年11月25日
【学习】Hierarchical Softmax
机器学习研究会
4+阅读 · 2017年8月6日
Auto-Encoding GAN
CreateAMind
7+阅读 · 2017年8月4日
强化学习 cartpole_a3c
CreateAMind
9+阅读 · 2017年7月21日
Arxiv
0+阅读 · 2021年1月7日
VIP会员
相关VIP内容
专知会员服务
53+阅读 · 2020年9月7日
Linux导论,Introduction to Linux,96页ppt
专知会员服务
79+阅读 · 2020年7月26日
Fariz Darari简明《博弈论Game Theory》介绍,35页ppt
专知会员服务
111+阅读 · 2020年5月15日
Python分布式计算,171页pdf,Distributed Computing with Python
专知会员服务
108+阅读 · 2020年5月3日
《DeepGCNs: Making GCNs Go as Deep as CNNs》
专知会员服务
31+阅读 · 2019年10月17日
强化学习最新教程,17页pdf
专知会员服务
177+阅读 · 2019年10月11日
相关资讯
计算机 | 入门级EI会议ICVRIS 2019诚邀稿件
Call4Papers
10+阅读 · 2019年6月24日
逆强化学习-学习人先验的动机
CreateAMind
16+阅读 · 2019年1月18日
强化学习的Unsupervised Meta-Learning
CreateAMind
17+阅读 · 2019年1月7日
Disentangled的假设的探讨
CreateAMind
9+阅读 · 2018年12月10日
Hierarchical Disentangled Representations
CreateAMind
4+阅读 · 2018年4月15日
计算机视觉近一年进展综述
机器学习研究会
9+阅读 · 2017年11月25日
【学习】Hierarchical Softmax
机器学习研究会
4+阅读 · 2017年8月6日
Auto-Encoding GAN
CreateAMind
7+阅读 · 2017年8月4日
强化学习 cartpole_a3c
CreateAMind
9+阅读 · 2017年7月21日
Top
微信扫码咨询专知VIP会员