Bertrand et al. introduced a model of parameterised systems, where each agent is represented by a finite state system, and studied the following control problem: for any number of agents, does there exist a controller able to bring all agents to a target state? They showed that the problem is decidable and EXPTIME-complete in the adversarial setting, and posed as an open problem the stochastic setting, where the agent is represented by a Markov decision process. In this paper, we show that the stochastic control problem is decidable. Our solution makes significant uses of well quasi orders, of the max-flow min-cut theorem, and of the theory of regular cost functions. We introduce an intermediate problem of independence interest called the sequential flow problem and study its complexity.


翻译:Bertrand等人引入了一个参数化系统模型,其中每种物剂都有一定的状态系统作为代表,并研究了以下控制问题:对于任何数个物剂来说,是否有一个控制器能够将所有物剂带入目标状态?它们表明,这个问题在对抗状态下是可以分解的,EXPTIME是完整的,并作为一个开放的问题提出了Stochistic环境,该物剂由Markov的决定程序作为代表。在本文中,我们表明,随机控制问题是可以分解的。我们的解决办法大量利用了良好的准定单、最大流量的微分定律和常规成本功能理论。我们引入了一个中间的独立利益问题,称为连续流程问题并研究其复杂性。

0
下载
关闭预览

相关内容

专知会员服务
90+阅读 · 2021年6月29日
Linux导论,Introduction to Linux,96页ppt
专知会员服务
79+阅读 · 2020年7月26日
【清华大学】图随机神经网络,Graph Random Neural Networks
专知会员服务
156+阅读 · 2020年5月26日
Fariz Darari简明《博弈论Game Theory》介绍,35页ppt
专知会员服务
111+阅读 · 2020年5月15日
强化学习最新教程,17页pdf
专知会员服务
177+阅读 · 2019年10月11日
强化学习三篇论文 避免遗忘等
CreateAMind
19+阅读 · 2019年5月24日
Hierarchically Structured Meta-learning
CreateAMind
26+阅读 · 2019年5月22日
Transferring Knowledge across Learning Processes
CreateAMind
28+阅读 · 2019年5月18日
深度自进化聚类:Deep Self-Evolution Clustering
我爱读PAMI
15+阅读 · 2019年4月13日
spinningup.openai 强化学习资源完整
CreateAMind
6+阅读 · 2018年12月17日
分布式TensorFlow入门指南
机器学习研究会
4+阅读 · 2017年11月28日
【学习】Hierarchical Softmax
机器学习研究会
4+阅读 · 2017年8月6日
Dimension-Free Empirical Entropy Estimation
Arxiv
0+阅读 · 2022年1月24日
Arxiv
5+阅读 · 2018年5月1日
Arxiv
3+阅读 · 2018年2月24日
VIP会员
Top
微信扫码咨询专知VIP会员