【普林斯顿博士论文】面向人本机器人学的安全与学习博弈论融合 - 专知VIP

会员服务 ·

1

机器人学 · 博弈论 · 博士论文 ·

【普林斯顿博士论文】面向人本机器人学的安全与学习博弈论融合

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

自主机器人正日益部署于复杂且有人类参与的环境中。为了在这些环境中实现高性能与高可信度，机器人不仅需要能够从数据中学习并适应环境中的动态不确定性，还必须能够对人类相关的安全问题进行稳健推理。传统方法往往将学习与安全相互割裂，或依赖过于简化的假设——例如假定人类意图或行为在交互过程中保持静态——从而增加了从社会性僵局到灾难性安全失效的风险。本论文提出了一个统一的博弈论框架，用于在人本机器人学中融合安全与学习，重点探讨能够在高风险、多智能体环境中实现可扩展且可验证决策的算法方法。具体而言，论文论述了如何在物理状态与信息状态（如信念）的联合空间中进行规划，使机器人能够在人本场景中做出安全且自适应的决策。首先，论文引入了一种通用安全过滤器框架（universal safety filter framework），该框架将稳健安全分析与概率推理相结合，实现可信的人机交互。通过闭合交互—学习回路，机器人能够在不牺牲安全性的前提下降低过度保守性。随后，研究探讨了**博弈论强化学习（game-theoretic reinforcement learning）如何在可计算的条件下为高维人类参与系统合成安全过滤器，既能保证训练收敛性，又能在存在对抗性输入的情况下减少策略的可被利用性。从更宏观的层面看，论文进一步研究了如何将博弈论式的协调机制扩展至大规模多智能体系统，以优化整体协同性能。通过结合机器人学习与基于模型的博弈论规划思想，作者展示了如何融合两者优势——既利用模型先验知识对安全与交互进行显式推理，又发挥学习行为模型的强泛化能力——从而合成兼具安全性与适应性的机器人策略。论文最后展望了下一代人本自治系统（human-centered autonomy）**的发展愿景：这些系统不仅能通过物理干预保障安全、增强信任，还能在部署于真实物理环境中时，主动与人类伙伴进行价值对齐，并提供可验证的安全保障。

成为VIP会员查看完整内容

0

相关内容

机器人学

【伯克利博士论文】构建可控人工智能的技巧与窍门

【伯克利博士论文】构建可控人工智能的技巧与窍门

专知会员服务

24+阅读 · 6月2日

【NYU博士论文】面向开放世界的人工智能：学习原则

【NYU博士论文】面向开放世界的人工智能：学习原则

专知会员服务

41+阅读 · 4月26日

【剑桥博士论文】面向多机器人系统的学习型协同感知与控制

【剑桥博士论文】面向多机器人系统的学习型协同感知与控制

专知会员服务

24+阅读 · 3月26日

【CMU博士论文】通过模块化与规模化解锁机器人技术的泛化能力

【CMU博士论文】通过模块化与规模化解锁机器人技术的泛化能力

专知会员服务

19+阅读 · 3月11日

【CUHK博士论文】现代机器学习中的因果性学习

【CUHK博士论文】现代机器学习中的因果性学习

专知会员服务

34+阅读 · 1月24日

【斯坦福博士论文】协作多机器人学习算法

【斯坦福博士论文】协作多机器人学习算法

专知会员服务

17+阅读 · 1月6日

【普林斯顿博士论文】驾驭现代芯片设计中的异构性与可扩展性

【普林斯顿博士论文】驾驭现代芯片设计中的异构性与可扩展性

专知会员服务

20+阅读 · 2024年8月13日

【普林斯顿博士论文】理解数据在模型决策中的作用

【普林斯顿博士论文】理解数据在模型决策中的作用

专知会员服务

41+阅读 · 2024年4月26日

【斯坦福博士论文】利用离线数据构建多功能强化学习智能体

【斯坦福博士论文】利用离线数据构建多功能强化学习智能体

专知会员服务

48+阅读 · 2022年9月14日

【斯坦福大学博士论文】现代机器学习优化问题：自适应、鲁棒性与隐私性

【斯坦福大学博士论文】现代机器学习优化问题：自适应、鲁棒性与隐私性

专知会员服务

69+阅读 · 2021年12月20日

【伯克利PNAS最新论文】可解释机器学习的定义、方法和应用

【伯克利PNAS最新论文】可解释机器学习的定义、方法和应用

专知

77+阅读 · 2019年10月20日

盘点当下大热的 7 大 Github 机器学习『创新』项目

盘点当下大热的 7 大 Github 机器学习『创新』项目

机器学习算法与Python学习

13+阅读 · 2019年9月20日

专访俞栋：多模态是迈向通用人工智能的重要方向

专访俞栋：多模态是迈向通用人工智能的重要方向

AI科技评论

26+阅读 · 2019年9月9日

论文 | 基于深度学习的序列推荐系统综述：概念、方法与实验评估

论文 | 基于深度学习的序列推荐系统综述：概念、方法与实验评估

LibRec智能推荐

41+阅读 · 2019年5月9日

【泡泡读者来搞】ROS、Simulink、Carsim的互联与规划、控制算法的验证

【泡泡读者来搞】ROS、Simulink、Carsim的互联与规划、控制算法的验证

泡泡机器人SLAM

14+阅读 · 2019年5月1日

医疗机器学习综述，谷歌Jeff Dean等最新论文【附12页论文下载】

医疗机器学习综述，谷歌Jeff Dean等最新论文【附12页论文下载】

专知

15+阅读 · 2019年4月6日

【机器学习】深入剖析机器学习中的统计思想

【机器学习】深入剖析机器学习中的统计思想

产业智能官

16+阅读 · 2019年1月24日

MIT&哈佛大学最新综述文章：NLP模型的分析方法

MIT&哈佛大学最新综述文章：NLP模型的分析方法

专知

24+阅读 · 2018年12月26日

隐私和机器学习：两个意想不到的盟友？一文了解差分隐私

隐私和机器学习：两个意想不到的盟友？一文了解差分隐私

专知

21+阅读 · 2018年5月14日

孪生网络实现小数据学习！看神经网络如何找出两张图片的相似点

孪生网络实现小数据学习！看神经网络如何找出两张图片的相似点

机器人圈

35+阅读 · 2017年7月18日

异构云小区网络中基于时延保证的资源配置新方法

国家自然科学基金

0+阅读 · 2015年12月31日

基于云计算平台的下一代测序数据错误修正算法研究与实现

国家自然科学基金

2+阅读 · 2015年12月31日

云计算下的加密域多媒体水印与模式匹配

国家自然科学基金

1+阅读 · 2015年12月31日

基于虚拟原型的信息物理融合系统高效可信构造研究

国家自然科学基金

7+阅读 · 2015年12月31日

面向大数据的安全迁移学习方法

国家自然科学基金

28+阅读 · 2015年12月31日

大数据环境下基于GMDH的客户分类半监督集成模型研究

国家自然科学基金

1+阅读 · 2014年12月31日

动态环境下决策单元效率评价方法与应用研究

国家自然科学基金

3+阅读 · 2014年12月31日

多设备在线租赁优化模型与竞争策略研究

国家自然科学基金

0+阅读 · 2014年12月31日

面向众核计算的数值方法协同设计--一种高效且高精度广义有限元方法研究

国家自然科学基金

2+阅读 · 2014年12月31日

多语言大数据环境下的复杂网络行为分析、预测和干预

国家自然科学基金

4+阅读 · 2014年12月31日

Is ChatGPT a Good Recommender? A Preliminary Study

Arxiv

171+阅读 · 2023年4月20日

A Comprehensive Survey on Deep Graph Representation Learning

Arxiv

103+阅读 · 2023年4月11日

On Efficient Training of Large-Scale Deep Learning Models: A Literature Review

Arxiv

219+阅读 · 2023年4月7日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

484+阅读 · 2023年3月31日

Unleashing the Power of Edge-Cloud Generative AI in Mobile Networks: A Survey of AIGC Services

Arxiv

151+阅读 · 2023年3月29日

ChatGPT is a Knowledgeable but Inexperienced Solver: An Investigation of Commonsense Problem in Large Language Models

Arxiv

62+阅读 · 2023年3月29日

Knowledge Graphs: Opportunities and Challenges

Arxiv

175+阅读 · 2023年3月24日

Sparks of Artificial General Intelligence: Early experiments with GPT-4

Arxiv

51+阅读 · 2023年3月22日

A Complete Survey on Generative AI (AIGC): Is ChatGPT from GPT-4 to GPT-5 All You Need?

Arxiv

84+阅读 · 2023年3月21日

Data-centric Artificial Intelligence: A Survey

Arxiv

25+阅读 · 2023年3月17日

VIP会员

相关主题

相关VIP内容

【伯克利博士论文】构建可控人工智能的技巧与窍门

【伯克利博士论文】构建可控人工智能的技巧与窍门

专知会员服务

24+阅读 · 6月2日

【NYU博士论文】面向开放世界的人工智能：学习原则

【NYU博士论文】面向开放世界的人工智能：学习原则

专知会员服务

41+阅读 · 4月26日

【剑桥博士论文】面向多机器人系统的学习型协同感知与控制

【剑桥博士论文】面向多机器人系统的学习型协同感知与控制

专知会员服务

24+阅读 · 3月26日

【CMU博士论文】通过模块化与规模化解锁机器人技术的泛化能力

【CMU博士论文】通过模块化与规模化解锁机器人技术的泛化能力

专知会员服务

19+阅读 · 3月11日

【CUHK博士论文】现代机器学习中的因果性学习

【CUHK博士论文】现代机器学习中的因果性学习

专知会员服务

34+阅读 · 1月24日

【斯坦福博士论文】协作多机器人学习算法

【斯坦福博士论文】协作多机器人学习算法

专知会员服务

17+阅读 · 1月6日

【普林斯顿博士论文】驾驭现代芯片设计中的异构性与可扩展性

【普林斯顿博士论文】驾驭现代芯片设计中的异构性与可扩展性

专知会员服务

20+阅读 · 2024年8月13日

【普林斯顿博士论文】理解数据在模型决策中的作用

【普林斯顿博士论文】理解数据在模型决策中的作用

专知会员服务

41+阅读 · 2024年4月26日

【斯坦福博士论文】利用离线数据构建多功能强化学习智能体

【斯坦福博士论文】利用离线数据构建多功能强化学习智能体

专知会员服务

48+阅读 · 2022年9月14日

【斯坦福大学博士论文】现代机器学习优化问题：自适应、鲁棒性与隐私性

【斯坦福大学博士论文】现代机器学习优化问题：自适应、鲁棒性与隐私性

专知会员服务

69+阅读 · 2021年12月20日

热门VIP内容

开通专知VIP会员享更多权益服务

赋能真实世界：基于大语言模型的产业智能体技术、实践与评测综述

军事行动中人工智能系统目标交战的附带损伤评估模型 | 最新文献

【普林斯顿博士论文】面向人本机器人学的安全与学习博弈论融合

美陆军协会（AUSA）2025 年会公布的美国十大武器与防务产品创新

相关资讯

【伯克利PNAS最新论文】可解释机器学习的定义、方法和应用

【伯克利PNAS最新论文】可解释机器学习的定义、方法和应用

专知

77+阅读 · 2019年10月20日

盘点当下大热的 7 大 Github 机器学习『创新』项目

盘点当下大热的 7 大 Github 机器学习『创新』项目

机器学习算法与Python学习

13+阅读 · 2019年9月20日

专访俞栋：多模态是迈向通用人工智能的重要方向

专访俞栋：多模态是迈向通用人工智能的重要方向

AI科技评论

26+阅读 · 2019年9月9日

论文 | 基于深度学习的序列推荐系统综述：概念、方法与实验评估

论文 | 基于深度学习的序列推荐系统综述：概念、方法与实验评估

LibRec智能推荐

41+阅读 · 2019年5月9日

【泡泡读者来搞】ROS、Simulink、Carsim的互联与规划、控制算法的验证

【泡泡读者来搞】ROS、Simulink、Carsim的互联与规划、控制算法的验证

泡泡机器人SLAM

14+阅读 · 2019年5月1日

医疗机器学习综述，谷歌Jeff Dean等最新论文【附12页论文下载】

医疗机器学习综述，谷歌Jeff Dean等最新论文【附12页论文下载】

专知

15+阅读 · 2019年4月6日

【机器学习】深入剖析机器学习中的统计思想

【机器学习】深入剖析机器学习中的统计思想

产业智能官

16+阅读 · 2019年1月24日

MIT&哈佛大学最新综述文章：NLP模型的分析方法

MIT&哈佛大学最新综述文章：NLP模型的分析方法

专知

24+阅读 · 2018年12月26日

隐私和机器学习：两个意想不到的盟友？一文了解差分隐私

隐私和机器学习：两个意想不到的盟友？一文了解差分隐私

专知

21+阅读 · 2018年5月14日

孪生网络实现小数据学习！看神经网络如何找出两张图片的相似点

孪生网络实现小数据学习！看神经网络如何找出两张图片的相似点

机器人圈

35+阅读 · 2017年7月18日

相关基金

异构云小区网络中基于时延保证的资源配置新方法

国家自然科学基金

0+阅读 · 2015年12月31日

基于云计算平台的下一代测序数据错误修正算法研究与实现

国家自然科学基金

2+阅读 · 2015年12月31日

云计算下的加密域多媒体水印与模式匹配

国家自然科学基金

1+阅读 · 2015年12月31日

基于虚拟原型的信息物理融合系统高效可信构造研究

国家自然科学基金

7+阅读 · 2015年12月31日

面向大数据的安全迁移学习方法

国家自然科学基金

28+阅读 · 2015年12月31日

大数据环境下基于GMDH的客户分类半监督集成模型研究

国家自然科学基金

1+阅读 · 2014年12月31日

动态环境下决策单元效率评价方法与应用研究

国家自然科学基金

3+阅读 · 2014年12月31日

多设备在线租赁优化模型与竞争策略研究

国家自然科学基金

0+阅读 · 2014年12月31日

面向众核计算的数值方法协同设计--一种高效且高精度广义有限元方法研究

国家自然科学基金

2+阅读 · 2014年12月31日

多语言大数据环境下的复杂网络行为分析、预测和干预

国家自然科学基金

4+阅读 · 2014年12月31日

相关论文

Is ChatGPT a Good Recommender? A Preliminary Study

Arxiv

171+阅读 · 2023年4月20日

A Comprehensive Survey on Deep Graph Representation Learning

Arxiv

103+阅读 · 2023年4月11日

On Efficient Training of Large-Scale Deep Learning Models: A Literature Review

Arxiv

219+阅读 · 2023年4月7日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

484+阅读 · 2023年3月31日

Unleashing the Power of Edge-Cloud Generative AI in Mobile Networks: A Survey of AIGC Services

Arxiv

151+阅读 · 2023年3月29日

ChatGPT is a Knowledgeable but Inexperienced Solver: An Investigation of Commonsense Problem in Large Language Models

Arxiv

62+阅读 · 2023年3月29日

Knowledge Graphs: Opportunities and Challenges

Arxiv

175+阅读 · 2023年3月24日

Sparks of Artificial General Intelligence: Early experiments with GPT-4

Arxiv

51+阅读 · 2023年3月22日

A Complete Survey on Generative AI (AIGC): Is ChatGPT from GPT-4 to GPT-5 All You Need?

Arxiv

84+阅读 · 2023年3月21日

Data-centric Artificial Intelligence: A Survey

Arxiv

25+阅读 · 2023年3月17日

微信扫码咨询专知VIP会员