Inferring models from samples of stochastic processes is challenging, even in the most basic setting in which processes are stationary and ergodic. A principle reason for this, discovered by Blackwell in 1957, is that finite-state generators produce realizations with arbitrarily-long dependencies that require an uncountable infinity of probabilistic features be tracked for optimal prediction. This, in turn, means predictive models are generically infinite-state. Specifically, hidden Markov chains, even if finite, generate stochastic processes that are irreducibly complicated. The consequences are dramatic. For one, no finite expression for their Shannon entropy rate exists. Said simply, one cannot make general statements about how random they are and finite models incur an irreducible excess degree of unpredictability. This was the state of affairs until a recently-introduced method showed how to accurately calculate their entropy rate and, constructively, to determine the minimal set of infinite predictive features. Leveraging this, here we address the complementary challenge of determining how structured hidden Markov processes are by calculating the rate of statistical complexity divergence -- the information dimension of the minimal set of predictive features.


翻译:从随机过程样本中推断模型是具有挑战性的,即使在程序是固定和随机的最基本的环境中也是如此。1957年,布莱克韦尔发现,造成这种情况的一个主要理由是,有限状态发电机具有任意的长期依赖性,需要追踪无法计算的无限概率特征,才能作出最佳预测。这反过来又意味着预测模型一般是无限的。具体地说,隐藏的马尔科夫链,即使有限,也会产生不可复制的复杂过程。后果是巨大的。对于一个问题,其香农诱导率没有有限的表达方式存在。简单地说,不能就它们是如何随机的和有限模型产生不可避免的过度不可预测性程度作一般性陈述。这就是直到最近采用的方法表明如何准确计算其恒温率,以及建设性地确定最起码的无限预测特征组。我们在此探讨如何通过计算统计复杂性的差异来确定结构化的隐形马可夫进程这一补充挑战,即最低预测特征的信息层面。

0
下载
关闭预览

相关内容

剑桥大学《数据科学: 原理与实践》课程,附PPT下载
专知会员服务
49+阅读 · 2021年1月20日
专知会员服务
50+阅读 · 2020年12月14日
Linux导论,Introduction to Linux,96页ppt
专知会员服务
77+阅读 · 2020年7月26日
鲁棒机器学习相关文献集
专知
8+阅读 · 2019年8月18日
计算机 | 国际会议信息5条
Call4Papers
3+阅读 · 2019年7月3日
Transferring Knowledge across Learning Processes
CreateAMind
27+阅读 · 2019年5月18日
逆强化学习-学习人先验的动机
CreateAMind
15+阅读 · 2019年1月18日
大数据 | 顶级SCI期刊专刊/国际会议信息7条
Call4Papers
10+阅读 · 2018年12月29日
A Technical Overview of AI & ML in 2018 & Trends for 2019
待字闺中
16+阅读 · 2018年12月24日
人工智能 | 国际会议信息10条
Call4Papers
5+阅读 · 2018年12月18日
计算机类 | 期刊专刊截稿信息9条
Call4Papers
4+阅读 · 2018年1月26日
【论文】变分推断(Variational inference)的总结
机器学习研究会
39+阅读 · 2017年11月16日
【推荐】(Keras)LSTM多元时序预测教程
机器学习研究会
24+阅读 · 2017年8月14日
Arxiv
0+阅读 · 2021年4月14日
VIP会员
相关资讯
鲁棒机器学习相关文献集
专知
8+阅读 · 2019年8月18日
计算机 | 国际会议信息5条
Call4Papers
3+阅读 · 2019年7月3日
Transferring Knowledge across Learning Processes
CreateAMind
27+阅读 · 2019年5月18日
逆强化学习-学习人先验的动机
CreateAMind
15+阅读 · 2019年1月18日
大数据 | 顶级SCI期刊专刊/国际会议信息7条
Call4Papers
10+阅读 · 2018年12月29日
A Technical Overview of AI & ML in 2018 & Trends for 2019
待字闺中
16+阅读 · 2018年12月24日
人工智能 | 国际会议信息10条
Call4Papers
5+阅读 · 2018年12月18日
计算机类 | 期刊专刊截稿信息9条
Call4Papers
4+阅读 · 2018年1月26日
【论文】变分推断(Variational inference)的总结
机器学习研究会
39+阅读 · 2017年11月16日
【推荐】(Keras)LSTM多元时序预测教程
机器学习研究会
24+阅读 · 2017年8月14日
Top
微信扫码咨询专知VIP会员