概率的非线性部分可观测系统的反向最优控制及局部线性化 (Probabilistic inverse optimal control with local linearization for non-linear partially observable systems) - 专知论文

会员服务 ·

0

线性化 · 最优 · 线性系统 · 概率 · 系统 ·

2023 年 3 月 29 日

Probabilistic inverse optimal control with local linearization for non-linear partially observable systems

翻译：概率的非线性部分可观测系统的反向最优控制及局部线性化

Dominik Straub,Matthias Schultheis,Heinz Koeppl,Constantin A. Rothkopf

Inverse optimal control methods can be used to characterize behavior in sequential decision-making tasks. Most existing work, however, requires the control signals to be known, or is limited to fully-observable or linear systems. This paper introduces a probabilistic approach to inverse optimal control for stochastic non-linear systems with missing control signals and partial observability that unifies existing approaches. By using an explicit model of the noise characteristics of the sensory and control systems of the agent in conjunction with local linearization techniques, we derive an approximate likelihood for the model parameters, which can be computed within a single forward pass. We evaluate our proposed method on stochastic and partially observable version of classic control tasks, a navigation task, and a manual reaching task. The proposed method has broad applicability, ranging from imitation learning to sensorimotor neuroscience.

翻译：反向最优控制方法可以用于表征序贯决策任务中的行为。然而，大部分现有工作要求控制信号必须已知，或者限于全观察或线性系统。本文介绍了一种针对具有缺失控制信号和部分可观测性的随机非线性系统的概率反向最优控制方法，并统一了现有方法。通过将代理人的感知和控制系统的噪声特征与局部线性化技术结合使用，我们导出了模型参数的近似似然函数，该函数可以在单次前向通过中计算得到。我们对经典控制任务、导航任务和手动伸手任务的随机和部分可观测版本进行了评估。该方法具有广泛的适用性，从模仿学习到感觉-运动神经科学。

0

相关内容

线性化

【干货书】数据分析优化，Optimization for Modern Data Analysis，117页pdf

【干货书】数据分析优化，Optimization for Modern Data Analysis，117页pdf

专知会员服务

66+阅读 · 2023年2月15日

干货书！基于单调算子的大规模凸优化，348页pdf

干货书！基于单调算子的大规模凸优化，348页pdf

专知会员服务

50+阅读 · 2022年7月24日

不可错过！《机器学习100讲》课程，UBC Mark Schmidt讲授

不可错过！《机器学习100讲》课程，UBC Mark Schmidt讲授

专知会员服务

76+阅读 · 2022年6月28日

南大《优化方法（Optimization Methods》课程，推荐！

南大《优化方法（Optimization Methods》课程，推荐！

专知会员服务

80+阅读 · 2022年4月3日

【硬核书】矩阵代数基础，248页pdf

【硬核书】矩阵代数基础，248页pdf

专知会员服务

88+阅读 · 2021年12月9日

【普林斯顿干货书】强化学习与随机优化，728页pdf阐述序列决策统一框架

【普林斯顿干货书】强化学习与随机优化，728页pdf阐述序列决策统一框架

专知会员服务

130+阅读 · 2021年4月25日

INRIA最新「机器学习理论」新书，229页pdf原理性阐述机器学习

INRIA最新「机器学习理论」新书，229页pdf原理性阐述机器学习

专知会员服务

69+阅读 · 2021年3月27日

INRIA 最新《机器学习理论》课程笔记，176页pdf

专知会员服务

51+阅读 · 2020年12月14日

【开放书】部分观测动态系统的贝叶斯学习，119页pdf，Bayesian Learning for partially observed dynamical systems

【开放书】部分观测动态系统的贝叶斯学习，119页pdf，Bayesian Learning for partially observed dynamical systems

专知会员服务

41+阅读 · 2019年12月27日

【CMU卡内基梅隆大学】深度学习在计算机视觉的应用：方法，解释，因果与公平性

【CMU卡内基梅隆大学】深度学习在计算机视觉的应用：方法，解释，因果与公平性

专知会员服务

83+阅读 · 2019年10月9日

Hierarchically Structured Meta-learning

Hierarchically Structured Meta-learning

CreateAMind

27+阅读 · 2019年5月22日

Transferring Knowledge across Learning Processes

Transferring Knowledge across Learning Processes

CreateAMind

29+阅读 · 2019年5月18日

【泡泡一分钟】优化对比度增强以提高SLAM重定位环境中视觉跟踪的稳健性

【泡泡一分钟】优化对比度增强以提高SLAM重定位环境中视觉跟踪的稳健性

泡泡机器人SLAM

10+阅读 · 2019年4月26日

逆强化学习-学习人先验的动机

逆强化学习-学习人先验的动机

CreateAMind

16+阅读 · 2019年1月18日

强化学习的Unsupervised Meta-Learning

强化学习的Unsupervised Meta-Learning

CreateAMind

18+阅读 · 2019年1月7日

Unsupervised Learning via Meta-Learning

Unsupervised Learning via Meta-Learning

CreateAMind

43+阅读 · 2019年1月3日

【论文推荐】最新六篇主题模型相关论文—领域特定知识库、神经变分推断、动态和静态主题模型

【论文推荐】最新六篇主题模型相关论文—领域特定知识库、神经变分推断、动态和静态主题模型

专知

19+阅读 · 2018年6月26日

【论文推荐】最新七篇强化学习相关论文—逻辑约束、综述、多任务深度强化学习、参数服务器、事件抽取、分层强化学习、过拟合研究

【论文推荐】最新七篇强化学习相关论文—逻辑约束、综述、多任务深度强化学习、参数服务器、事件抽取、分层强化学习、过拟合研究

专知

25+阅读 · 2018年4月29日

【论文】变分推断（Variational inference)的总结

【论文】变分推断（Variational inference)的总结

机器学习研究会

39+阅读 · 2017年11月16日

【推荐】免费书(草稿)：数据科学的数学基础

【推荐】免费书(草稿)：数据科学的数学基础

机器学习研究会

20+阅读 · 2017年10月1日

一类具有光滑结构的非光滑随机优化的分解方法

国家自然科学基金

0+阅读 · 2013年12月31日

离散观测扩散过程参数极大似然估计的高效算法研究

国家自然科学基金

1+阅读 · 2013年12月31日

某些耦合系统的控制问题

国家自然科学基金

0+阅读 · 2013年12月31日

基于多智能体系统的分布式凸优化算法研究

国家自然科学基金

3+阅读 · 2013年12月31日

随机混合时滞系统的稳定性分析与脉冲控制器设计

国家自然科学基金

0+阅读 · 2013年12月31日

Fitzhugh-Nagumo方程和抛物型方程组的时间最优控制问题

国家自然科学基金

0+阅读 · 2012年12月31日

无穷维动力系统的随机小扰动

国家自然科学基金

0+阅读 · 2012年12月31日

基于积分模度量的折线模糊神经网络与广义模糊系统的逼近分析及图像处理

国家自然科学基金

0+阅读 · 2012年12月31日

一类微分包含动力系统吸引子分岔和吸引域演化

国家自然科学基金

0+阅读 · 2011年12月31日

一类插值曲面的设计及其自适应最优离散算法

国家自然科学基金

0+阅读 · 2009年12月31日

Formalising causal inference in time and frequency on process graphs with latent components

Arxiv

0+阅读 · 2023年5月19日

Generalised likelihood profiles for models with intractable likelihoods

Arxiv

0+阅读 · 2023年5月19日

PETAL: Physics Emulation Through Averaged Linearizations for Solving Inverse Problems

Arxiv

0+阅读 · 2023年5月18日

Robotic Gas Source Localization with Probabilistic Mapping and Online Dispersion Simulation

Arxiv

0+阅读 · 2023年5月18日

Dirichlet-Neumann learning algorithm for solving elliptic interface problems

Arxiv

0+阅读 · 2023年5月17日

An unambiguous and robust formulation for Wannier localization

Arxiv

0+阅读 · 2023年5月17日

Weak Limits for Empirical Entropic Optimal Transport: Beyond Smooth Costs

Arxiv

0+阅读 · 2023年5月16日

On Neural Differential Equations

Arxiv

23+阅读 · 2022年2月4日

Causality and Generalizability: Identifiability and Learning Methods

Arxiv

12+阅读 · 2021年10月4日

Minimal Variance Sampling with Provable Guarantees for Fast Training of Graph Neural Networks

Minimal Variance Sampling with Provable Guarantees for Fast Training of Graph Neural Networks

Arxiv

13+阅读 · 2020年6月24日

VIP会员

文章信息

相关主题

相关VIP内容

【干货书】数据分析优化，Optimization for Modern Data Analysis，117页pdf

【干货书】数据分析优化，Optimization for Modern Data Analysis，117页pdf

专知会员服务

66+阅读 · 2023年2月15日

干货书！基于单调算子的大规模凸优化，348页pdf

干货书！基于单调算子的大规模凸优化，348页pdf

专知会员服务

50+阅读 · 2022年7月24日

不可错过！《机器学习100讲》课程，UBC Mark Schmidt讲授

不可错过！《机器学习100讲》课程，UBC Mark Schmidt讲授

专知会员服务

76+阅读 · 2022年6月28日

南大《优化方法（Optimization Methods》课程，推荐！

南大《优化方法（Optimization Methods》课程，推荐！

专知会员服务

80+阅读 · 2022年4月3日

【硬核书】矩阵代数基础，248页pdf

【硬核书】矩阵代数基础，248页pdf

专知会员服务

88+阅读 · 2021年12月9日

【普林斯顿干货书】强化学习与随机优化，728页pdf阐述序列决策统一框架

【普林斯顿干货书】强化学习与随机优化，728页pdf阐述序列决策统一框架

专知会员服务

130+阅读 · 2021年4月25日

INRIA最新「机器学习理论」新书，229页pdf原理性阐述机器学习

INRIA最新「机器学习理论」新书，229页pdf原理性阐述机器学习

专知会员服务

69+阅读 · 2021年3月27日

INRIA 最新《机器学习理论》课程笔记，176页pdf

专知会员服务

51+阅读 · 2020年12月14日

【开放书】部分观测动态系统的贝叶斯学习，119页pdf，Bayesian Learning for partially observed dynamical systems

【开放书】部分观测动态系统的贝叶斯学习，119页pdf，Bayesian Learning for partially observed dynamical systems

专知会员服务

41+阅读 · 2019年12月27日

【CMU卡内基梅隆大学】深度学习在计算机视觉的应用：方法，解释，因果与公平性

【CMU卡内基梅隆大学】深度学习在计算机视觉的应用：方法，解释，因果与公平性

专知会员服务

83+阅读 · 2019年10月9日

热门VIP内容

开通专知VIP会员享更多权益服务

【CMU博士论文】基础模型训练中网络规模数据的负责任与高效使用

《俄乌战争背景下俄罗斯的战略性海军分析（2022-2025年）》最新100页报告

人工智能时代背景下的未来海战

相关资讯

Hierarchically Structured Meta-learning

Hierarchically Structured Meta-learning

CreateAMind

27+阅读 · 2019年5月22日

Transferring Knowledge across Learning Processes

Transferring Knowledge across Learning Processes

CreateAMind

29+阅读 · 2019年5月18日

【泡泡一分钟】优化对比度增强以提高SLAM重定位环境中视觉跟踪的稳健性

【泡泡一分钟】优化对比度增强以提高SLAM重定位环境中视觉跟踪的稳健性

泡泡机器人SLAM

10+阅读 · 2019年4月26日

逆强化学习-学习人先验的动机

逆强化学习-学习人先验的动机

CreateAMind

16+阅读 · 2019年1月18日

强化学习的Unsupervised Meta-Learning

强化学习的Unsupervised Meta-Learning

CreateAMind

18+阅读 · 2019年1月7日

Unsupervised Learning via Meta-Learning

Unsupervised Learning via Meta-Learning

CreateAMind

43+阅读 · 2019年1月3日

【论文推荐】最新六篇主题模型相关论文—领域特定知识库、神经变分推断、动态和静态主题模型

【论文推荐】最新六篇主题模型相关论文—领域特定知识库、神经变分推断、动态和静态主题模型

专知

19+阅读 · 2018年6月26日

【论文推荐】最新七篇强化学习相关论文—逻辑约束、综述、多任务深度强化学习、参数服务器、事件抽取、分层强化学习、过拟合研究

【论文推荐】最新七篇强化学习相关论文—逻辑约束、综述、多任务深度强化学习、参数服务器、事件抽取、分层强化学习、过拟合研究

专知

25+阅读 · 2018年4月29日

【论文】变分推断（Variational inference)的总结

【论文】变分推断（Variational inference)的总结

机器学习研究会

39+阅读 · 2017年11月16日

【推荐】免费书(草稿)：数据科学的数学基础

【推荐】免费书(草稿)：数据科学的数学基础

机器学习研究会

20+阅读 · 2017年10月1日

相关论文

Formalising causal inference in time and frequency on process graphs with latent components

Arxiv

0+阅读 · 2023年5月19日

Generalised likelihood profiles for models with intractable likelihoods

Arxiv

0+阅读 · 2023年5月19日

PETAL: Physics Emulation Through Averaged Linearizations for Solving Inverse Problems

Arxiv

0+阅读 · 2023年5月18日

Robotic Gas Source Localization with Probabilistic Mapping and Online Dispersion Simulation

Arxiv

0+阅读 · 2023年5月18日

Dirichlet-Neumann learning algorithm for solving elliptic interface problems

Arxiv

0+阅读 · 2023年5月17日

An unambiguous and robust formulation for Wannier localization

Arxiv

0+阅读 · 2023年5月17日

Weak Limits for Empirical Entropic Optimal Transport: Beyond Smooth Costs

Arxiv

0+阅读 · 2023年5月16日

On Neural Differential Equations

Arxiv

23+阅读 · 2022年2月4日

Causality and Generalizability: Identifiability and Learning Methods

Arxiv

12+阅读 · 2021年10月4日

Minimal Variance Sampling with Provable Guarantees for Fast Training of Graph Neural Networks

Minimal Variance Sampling with Provable Guarantees for Fast Training of Graph Neural Networks

Arxiv

13+阅读 · 2020年6月24日

相关基金

一类具有光滑结构的非光滑随机优化的分解方法

国家自然科学基金

0+阅读 · 2013年12月31日

离散观测扩散过程参数极大似然估计的高效算法研究

国家自然科学基金

1+阅读 · 2013年12月31日

某些耦合系统的控制问题

国家自然科学基金

0+阅读 · 2013年12月31日

基于多智能体系统的分布式凸优化算法研究

国家自然科学基金

3+阅读 · 2013年12月31日

随机混合时滞系统的稳定性分析与脉冲控制器设计

国家自然科学基金

0+阅读 · 2013年12月31日

Fitzhugh-Nagumo方程和抛物型方程组的时间最优控制问题

国家自然科学基金

0+阅读 · 2012年12月31日

无穷维动力系统的随机小扰动

国家自然科学基金

0+阅读 · 2012年12月31日

基于积分模度量的折线模糊神经网络与广义模糊系统的逼近分析及图像处理

国家自然科学基金

0+阅读 · 2012年12月31日

一类微分包含动力系统吸引子分岔和吸引域演化

国家自然科学基金

0+阅读 · 2011年12月31日

一类插值曲面的设计及其自适应最优离散算法

国家自然科学基金

0+阅读 · 2009年12月31日

微信扫码咨询专知VIP会员