如何稳健决策？MIT最新博士论文《鲁棒决策的端到端学习》234页pdf - 专知

会员服务 ·

0

如何稳健决策？MIT最新博士论文《鲁棒决策的端到端学习》234页pdf

2022 年 9 月 1 日 专知

由于物理世界是复杂的、模糊的、不可预测的，自主的智能体必须被设计成表现出人类水平的灵活性和通用性——远远超出我们显式编程的能力。这种自主的实现不仅能够可靠地解决特定的问题，而且还能够预测可能出现的错误，以便制定战略、适应和持续学习。要想做出如此丰富而复杂的决策，就需要在自主学习生命周期的所有阶段重新思考智能的基础。

在本论文中，我们开发了新的基于学习的方法，以实现自主系统的动态、弹性和稳健决策。通过解决在所有阶段出现的关键挑战，从用于训练的数据，到在这些数据上学习的模型，再到算法，以可靠地适应部署期间的意外事件，来推进野外的鲁棒决策。我们首先探索如何通过计算设计丰富的合成环境，能够模拟连续的难以收集的、分布外的边缘情况，在训练和评估期间易于使用。利用这个丰富的数据基础，我们随后创建了高效、富有表现力的学习模型，以及优化其表示的必要算法，并克服了代表性不足和具有挑战性的数据中的不平衡。最后，使用经过训练的模型，我们将转向部署设置，在该设置中，我们仍然应该预期我们的系统将面临在训练中从未遇到过的全新场景。为此，我们开发了自适应和不确定性感知算法来估计模型的不确定性，并利用它的存在来实现一般化的决策，即使是在存在意外事件的情况下。

专知便捷查看

便捷下载，请关注专知公众号（点击上方蓝色专知关注）

后台回复“LRDM” 就可以获取《如何稳健决策？MIT最新博士论文《鲁棒决策的端到端学习》234页pdf》专知下载链接

专知，专业可信的人工智能知识分发 ，让认知协作更快更好！欢迎注册登录专知www.zhuanzhi.ai，获取100000+AI(AI与军事、医药、公安等)主题干货知识资料！

欢迎微信扫一扫加入专知人工智能知识星球群，获取最新AI专业干货知识教程资料和与专家交流咨询！

点击“ 阅读原文 ”，了解使用专知 ，查看获取100000+AI主题知识资料

登录查看更多

4

相关内容

【牛津大学博士论文】深度强化学习的归纳偏差和泛化,168页pdf

【牛津大学博士论文】深度强化学习的归纳偏差和泛化,168页pdf

专知会员服务

113+阅读 · 2022年10月6日

《实现具有一致性和全局最优的鲁棒多智能体自主水下检测方法》密歇根大学150页博士论文

《实现具有一致性和全局最优的鲁棒多智能体自主水下检测方法》密歇根大学150页博士论文

专知会员服务

31+阅读 · 2022年9月29日

【MIT博士论文】对抗场景中鲁棒且可扩展的多智能体强化学习，123页pdf

【MIT博士论文】对抗场景中鲁棒且可扩展的多智能体强化学习，123页pdf

专知会员服务

104+阅读 · 2022年9月21日

【牛津大学博士论文】元强化学习的快速自适应，217页pdf

【牛津大学博士论文】元强化学习的快速自适应，217页pdf

专知会员服务

104+阅读 · 2022年9月19日

【MIT博士论文】实用机器学习的高效鲁棒算法，142页pdf

【MIT博士论文】实用机器学习的高效鲁棒算法，142页pdf

专知会员服务

59+阅读 · 2022年9月7日

【MIT博士论文】数据高效强化学习，176页pdf

【MIT博士论文】数据高效强化学习，176页pdf

专知会员服务

88+阅读 · 2022年7月11日

Berkeley博士论文《反馈系统中的可信机器学习》203页pdf

Berkeley博士论文《反馈系统中的可信机器学习》203页pdf

专知会员服务

40+阅读 · 2022年3月25日

【新书】感知和行动的贝叶斯模型，348页pdf

【新书】感知和行动的贝叶斯模型，348页pdf

专知会员服务

75+阅读 · 2021年11月18日

最新《持续学习机器人技术：定义，框架，学习策略，机会与挑战》综述论文，17页pdf

最新《持续学习机器人技术：定义，框架，学习策略，机会与挑战》综述论文，17页pdf

专知会员服务

56+阅读 · 2020年12月11日

【新书册】贝叶斯神经网络，41页pdf

【新书册】贝叶斯神经网络，41页pdf

专知会员服务

179+阅读 · 2020年6月3日

【牛津大学博士论文】解释黑盒算法:认识论挑战和机器学习解决方案，247页pdf

【牛津大学博士论文】解释黑盒算法:认识论挑战和机器学习解决方案，247页pdf

专知

2+阅读 · 2022年10月26日

【牛津大学博士论文】强化学习系统的数据高效部署，165页pdf

【牛津大学博士论文】强化学习系统的数据高效部署，165页pdf

专知

10+阅读 · 2022年10月15日

【牛津大学博士论文】深度迁移学习贝叶斯推断，157页pdf

【牛津大学博士论文】深度迁移学习贝叶斯推断，157页pdf

专知

5+阅读 · 2022年9月28日

【MIT博士论文】非线性系统鲁棒验证与优化，123页pdf

【MIT博士论文】非线性系统鲁棒验证与优化，123页pdf

专知

3+阅读 · 2022年9月23日

【MIT博士论文】通过奇异值分解、端到端基于模型的方法和奖励塑造的有效强化学习

【MIT博士论文】通过奇异值分解、端到端基于模型的方法和奖励塑造的有效强化学习

专知

1+阅读 · 2022年9月22日

【MIT博士论文】对抗场景中鲁棒且可扩展的多智能体强化学习，123页pdf

【MIT博士论文】对抗场景中鲁棒且可扩展的多智能体强化学习，123页pdf

专知

8+阅读 · 2022年9月21日

【牛津大学博士论文】元强化学习的快速自适应，217页pdf

【牛津大学博士论文】元强化学习的快速自适应，217页pdf

专知

29+阅读 · 2022年9月19日

【MIT博士论文】实用机器学习的高效鲁棒算法，142页pdf

【MIT博士论文】实用机器学习的高效鲁棒算法，142页pdf

专知

5+阅读 · 2022年9月7日

【MIT博士论文】机器学习与因果关系:建立高效、可靠的决策模型，164页pdf

【MIT博士论文】机器学习与因果关系:建立高效、可靠的决策模型，164页pdf

专知

7+阅读 · 2022年7月10日

【新书册】贝叶斯神经网络，41页pdf

【新书册】贝叶斯神经网络，41页pdf

专知

29+阅读 · 2020年6月3日

多智能体系统的聚类一致问题研究

国家自然科学基金

2+阅读 · 2014年12月31日

非重复系统的鲁棒迭代学习控制及其在多智能体系统中的应用

国家自然科学基金

0+阅读 · 2014年12月31日

基于逆向强化学习和人工智能的移动机器人自主学习方法研究

国家自然科学基金

12+阅读 · 2013年12月31日

三维频率-空间域迭代法声波叠前全波形速度反演的关键问题研究

国家自然科学基金

0+阅读 · 2012年12月31日

复杂不确定环境下鲁棒投资组合优化模型及决策研究

国家自然科学基金

4+阅读 · 2012年12月31日

有限注意力配置下的鲁棒动态投资决策与金融传染问题

国家自然科学基金

0+阅读 · 2012年12月31日

面向复杂不确定型决策的案例决策分析理论与方法研究

国家自然科学基金

7+阅读 · 2012年12月31日

基于智能模糊动态特征模型的高超声速飞行器先进控制

国家自然科学基金

1+阅读 · 2010年12月31日

无线传感器网络数据管理自适应处理研究

国家自然科学基金

0+阅读 · 2009年12月31日

基于公理模糊集理论的模糊机器学习

国家自然科学基金

4+阅读 · 2008年12月31日

Aligning Source Visual and Target Language Domains for Unpaired Video Captioning

Arxiv

0+阅读 · 2022年11月22日

Deep learning and American options via free boundary framework

Arxiv

0+阅读 · 2022年11月21日

UniSumm: Unified Few-shot Summarization with Multi-Task Pre-Training and Prefix-Tuning

UniSumm: Unified Few-shot Summarization with Multi-Task Pre-Training and Prefix-Tuning

Arxiv

0+阅读 · 2022年11月21日

The Runner-up Solution for YouTube-VIS Long Video Challenge 2022

Arxiv

0+阅读 · 2022年11月18日

Domain Generalization in Vision: A Survey

Arxiv

16+阅读 · 2021年7月18日

Equilibrium Refinements for Multi-Agent Influence Diagrams: Theory and Practice

Equilibrium Refinements for Multi-Agent Influence Diagrams: Theory and Practice

Arxiv

15+阅读 · 2021年2月9日

Machine Reasoning Explainability

Arxiv

14+阅读 · 2020年9月1日

Curriculum Learning for Reinforcement Learning Domains: A Framework and Survey

Curriculum Learning for Reinforcement Learning Domains: A Framework and Survey

Arxiv

20+阅读 · 2020年3月10日

The Book of Why: Review

Arxiv

15+阅读 · 2019年9月30日

Optimization Models for Machine Learning: A Survey

Arxiv

18+阅读 · 2019年1月16日

VIP会员

相关主题

端到端学习

麻省理工学院

相关VIP内容

【牛津大学博士论文】深度强化学习的归纳偏差和泛化,168页pdf

【牛津大学博士论文】深度强化学习的归纳偏差和泛化,168页pdf

专知会员服务

113+阅读 · 2022年10月6日

《实现具有一致性和全局最优的鲁棒多智能体自主水下检测方法》密歇根大学150页博士论文

《实现具有一致性和全局最优的鲁棒多智能体自主水下检测方法》密歇根大学150页博士论文

专知会员服务

31+阅读 · 2022年9月29日

【MIT博士论文】对抗场景中鲁棒且可扩展的多智能体强化学习，123页pdf

【MIT博士论文】对抗场景中鲁棒且可扩展的多智能体强化学习，123页pdf

专知会员服务

104+阅读 · 2022年9月21日

【牛津大学博士论文】元强化学习的快速自适应，217页pdf

【牛津大学博士论文】元强化学习的快速自适应，217页pdf

专知会员服务

104+阅读 · 2022年9月19日

【MIT博士论文】实用机器学习的高效鲁棒算法，142页pdf

【MIT博士论文】实用机器学习的高效鲁棒算法，142页pdf

专知会员服务

59+阅读 · 2022年9月7日

【MIT博士论文】数据高效强化学习，176页pdf

【MIT博士论文】数据高效强化学习，176页pdf

专知会员服务

88+阅读 · 2022年7月11日

Berkeley博士论文《反馈系统中的可信机器学习》203页pdf

Berkeley博士论文《反馈系统中的可信机器学习》203页pdf

专知会员服务

40+阅读 · 2022年3月25日

【新书】感知和行动的贝叶斯模型，348页pdf

【新书】感知和行动的贝叶斯模型，348页pdf

专知会员服务

75+阅读 · 2021年11月18日

最新《持续学习机器人技术：定义，框架，学习策略，机会与挑战》综述论文，17页pdf

最新《持续学习机器人技术：定义，框架，学习策略，机会与挑战》综述论文，17页pdf

专知会员服务

56+阅读 · 2020年12月11日

【新书册】贝叶斯神经网络，41页pdf

【新书册】贝叶斯神经网络，41页pdf

专知会员服务

179+阅读 · 2020年6月3日

热门VIP内容

开通专知VIP会员享更多权益服务

《美陆军徒步机动作战条令手册》最新168页

【博士论文】基于不确定性的可靠性：现代机器学习中的选择性预测与可信部署

军事后勤数字化未来展望

《美海军后勤体系整合与创新挑战》最新报告

相关资讯

【牛津大学博士论文】解释黑盒算法:认识论挑战和机器学习解决方案，247页pdf

【牛津大学博士论文】解释黑盒算法:认识论挑战和机器学习解决方案，247页pdf

专知

2+阅读 · 2022年10月26日

【牛津大学博士论文】强化学习系统的数据高效部署，165页pdf

【牛津大学博士论文】强化学习系统的数据高效部署，165页pdf

专知

10+阅读 · 2022年10月15日

【牛津大学博士论文】深度迁移学习贝叶斯推断，157页pdf

【牛津大学博士论文】深度迁移学习贝叶斯推断，157页pdf

专知

5+阅读 · 2022年9月28日

【MIT博士论文】非线性系统鲁棒验证与优化，123页pdf

【MIT博士论文】非线性系统鲁棒验证与优化，123页pdf

专知

3+阅读 · 2022年9月23日

【MIT博士论文】通过奇异值分解、端到端基于模型的方法和奖励塑造的有效强化学习

【MIT博士论文】通过奇异值分解、端到端基于模型的方法和奖励塑造的有效强化学习

专知

1+阅读 · 2022年9月22日

【MIT博士论文】对抗场景中鲁棒且可扩展的多智能体强化学习，123页pdf

【MIT博士论文】对抗场景中鲁棒且可扩展的多智能体强化学习，123页pdf

专知

8+阅读 · 2022年9月21日

【牛津大学博士论文】元强化学习的快速自适应，217页pdf

【牛津大学博士论文】元强化学习的快速自适应，217页pdf

专知

29+阅读 · 2022年9月19日

【MIT博士论文】实用机器学习的高效鲁棒算法，142页pdf

【MIT博士论文】实用机器学习的高效鲁棒算法，142页pdf

专知

5+阅读 · 2022年9月7日

【MIT博士论文】机器学习与因果关系:建立高效、可靠的决策模型，164页pdf

【MIT博士论文】机器学习与因果关系:建立高效、可靠的决策模型，164页pdf

专知

7+阅读 · 2022年7月10日

【新书册】贝叶斯神经网络，41页pdf

【新书册】贝叶斯神经网络，41页pdf

专知

29+阅读 · 2020年6月3日

相关基金

多智能体系统的聚类一致问题研究

国家自然科学基金

2+阅读 · 2014年12月31日

非重复系统的鲁棒迭代学习控制及其在多智能体系统中的应用

国家自然科学基金

0+阅读 · 2014年12月31日

基于逆向强化学习和人工智能的移动机器人自主学习方法研究

国家自然科学基金

12+阅读 · 2013年12月31日

三维频率-空间域迭代法声波叠前全波形速度反演的关键问题研究

国家自然科学基金

0+阅读 · 2012年12月31日

复杂不确定环境下鲁棒投资组合优化模型及决策研究

国家自然科学基金

4+阅读 · 2012年12月31日

有限注意力配置下的鲁棒动态投资决策与金融传染问题

国家自然科学基金

0+阅读 · 2012年12月31日

面向复杂不确定型决策的案例决策分析理论与方法研究

国家自然科学基金

7+阅读 · 2012年12月31日

基于智能模糊动态特征模型的高超声速飞行器先进控制

国家自然科学基金

1+阅读 · 2010年12月31日

无线传感器网络数据管理自适应处理研究

国家自然科学基金

0+阅读 · 2009年12月31日

基于公理模糊集理论的模糊机器学习

国家自然科学基金

4+阅读 · 2008年12月31日

相关论文

Aligning Source Visual and Target Language Domains for Unpaired Video Captioning

Arxiv

0+阅读 · 2022年11月22日

Deep learning and American options via free boundary framework

Arxiv

0+阅读 · 2022年11月21日

UniSumm: Unified Few-shot Summarization with Multi-Task Pre-Training and Prefix-Tuning

UniSumm: Unified Few-shot Summarization with Multi-Task Pre-Training and Prefix-Tuning

Arxiv

0+阅读 · 2022年11月21日

The Runner-up Solution for YouTube-VIS Long Video Challenge 2022

Arxiv

0+阅读 · 2022年11月18日

Domain Generalization in Vision: A Survey

Arxiv

16+阅读 · 2021年7月18日

Equilibrium Refinements for Multi-Agent Influence Diagrams: Theory and Practice

Equilibrium Refinements for Multi-Agent Influence Diagrams: Theory and Practice

Arxiv

15+阅读 · 2021年2月9日

Machine Reasoning Explainability

Arxiv

14+阅读 · 2020年9月1日

Curriculum Learning for Reinforcement Learning Domains: A Framework and Survey

Curriculum Learning for Reinforcement Learning Domains: A Framework and Survey

Arxiv

20+阅读 · 2020年3月10日

The Book of Why: Review

Arxiv

15+阅读 · 2019年9月30日

Optimization Models for Machine Learning: A Survey

Arxiv

18+阅读 · 2019年1月16日

大家都在搜

软件无线电

无人机集群

国防科技创新

久别重逢话双塔

再见，TD-SCDMA！

微信扫码咨询专知VIP会员