【博士论文】面向开放式世界的鲁棒智能体 - 专知VIP

会员服务 ·

0

鲁棒智能体 · 人工智能 ·

【博士论文】面向开放式世界的鲁棒智能体

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

随着人工智能（AI）在各类应用中的日益普及，能够在不断变化、开放式的世界中成功导航并适应的智能体变得愈发重要。一个关键挑战在于确保这些 AI 智能体具备鲁棒性，不仅能在训练过程中观察到的熟悉环境中表现出色，还能够有效泛化到先前未见、具有多样性的全新情境中。在本论文中，我们结合开放式生成（open-endedness）和多智能体学习的方法，训练并评估能够在新环境、分布外输入，以及与其他协同玩家智能体互动中实现泛化的鲁棒 AI 智能体。

我们首先介绍 MiniHack，一个基于程序化内容生成（procedural content generation）的沙盒框架，可用于构建多样化的环境。MiniHack 源自 NetHack 游戏，使研究者能够为强化学习（RL）智能体构建聚焦于泛化能力的新任务。随后，我们提出 Maestro，一种新颖的方法，用于生成对抗式课程，以在双人零和博弈中逐步提升 RL 智能体的鲁棒性与泛化能力。

接着，我们在多智能体领域进一步探究鲁棒性，采用质量-多样性（quality-diversity）方法系统地识别复杂足球电子游戏领域中最先进的预训练 RL 策略的脆弱性。该领域兼具协作与对抗动态，使得策略的鲁棒性分析更加具有挑战性。最后，我们将鲁棒性研究扩展至大型语言模型（LLMs）。在这一部分中，我们重点诊断并提升 LLM 面对对抗提示（adversarial prompts）时的鲁棒性，通过进化搜索生成多样且有效的输入，以诱导 LLM 产生不期望的输出。

总体而言，本论文为未来 AI 鲁棒性的发展奠定基础，使智能体不仅能够适应不断演化的世界，还能够在面对未知挑战与交互时保持卓越表现。

成为VIP会员查看完整内容

0

相关内容

鲁棒智能体

鲁棒智能体

【牛津博士论文】面向视觉、物理与语言应用的可信机器学习模型

【牛津博士论文】面向视觉、物理与语言应用的可信机器学习模型

专知会员服务

17+阅读 · 10月5日

【CMU博士论文】以人为中心的强化学习

【CMU博士论文】以人为中心的强化学习

专知会员服务

21+阅读 · 8月16日

【CMU博士论文】基于课程学习的鲁棒强化学习

【CMU博士论文】基于课程学习的鲁棒强化学习

专知会员服务

19+阅读 · 3月27日

【ETZH博士论文】数据驱动的人工智能

【ETZH博士论文】数据驱动的人工智能

专知会员服务

37+阅读 · 2月21日

【CMU博士论文】构建通用机器人生成范式：基础设施、规模化与策略学习

【CMU博士论文】构建通用机器人生成范式：基础设施、规模化与策略学习

专知会员服务

22+阅读 · 2月9日

【CUHK博士论文】现代机器学习中的因果性学习

【CUHK博士论文】现代机器学习中的因果性学习

专知会员服务

35+阅读 · 1月24日

【CMU博士论文】使用数据不确定解释的可信学习

【CMU博士论文】使用数据不确定解释的可信学习

专知会员服务

28+阅读 · 2024年11月2日

【ETHZ博士论文】人工智能的鲁棒性和公平性的正式和统计认证

【ETHZ博士论文】人工智能的鲁棒性和公平性的正式和统计认证

专知会员服务

27+阅读 · 2024年10月11日

可解释AI《增加自主智能体透明度的用户直观解释》论文，雷神技术研究中心

可解释AI《增加自主智能体透明度的用户直观解释》论文，雷神技术研究中心

专知会员服务

47+阅读 · 2023年3月20日

【NUS博士论文】深度视觉算法的对抗鲁棒性研究

【NUS博士论文】深度视觉算法的对抗鲁棒性研究

专知会员服务

34+阅读 · 2022年11月25日

【斯坦福博士论文】将深度学习机器人学习扩展到广泛的现实世界数据，176页pdf

【斯坦福博士论文】将深度学习机器人学习扩展到广泛的现实世界数据，176页pdf

专知

12+阅读 · 2023年4月4日

推荐！【DARPA终身学习机器（L2M）】《自主系统中用于感知和行动的终身学习》美空军、宾大2022最新234页技术报告

推荐！【DARPA终身学习机器（L2M）】《自主系统中用于感知和行动的终身学习》美空军、宾大2022最新234页技术报告

专知

25+阅读 · 2022年11月24日

推荐！《用于兵棋推演和建模的人工智能》兰德、耶鲁大学2022最新16页论文

推荐！《用于兵棋推演和建模的人工智能》兰德、耶鲁大学2022最新16页论文

专知

52+阅读 · 2022年11月14日

《使用机器学习智能体设计基于模拟的空战飞行员训练系统》2022瑞典林雪平大学页论文

《使用机器学习智能体设计基于模拟的空战飞行员训练系统》2022瑞典林雪平大学页论文

专知

39+阅读 · 2022年10月30日

【伯克利博士论文】硬件感知的高效深度学习，154页pdf

【伯克利博士论文】硬件感知的高效深度学习，154页pdf

专知

10+阅读 · 2022年10月20日

【牛津大学博士论文】强化学习系统的数据高效部署，165页pdf

【牛津大学博士论文】强化学习系统的数据高效部署，165页pdf

专知

12+阅读 · 2022年10月15日

【牛津大学博士论文】深度强化学习的归纳偏差和泛化,168页pdf

【牛津大学博士论文】深度强化学习的归纳偏差和泛化,168页pdf

专知

10+阅读 · 2022年10月6日

《基于多智能体深度强化学习的空战模拟智能体协作》瑞典林雪平大学

《基于多智能体深度强化学习的空战模拟智能体协作》瑞典林雪平大学

专知

62+阅读 · 2022年8月25日

最新《可解释机器学习》报告，164页ppt建模阐述XAI进展

最新《可解释机器学习》报告，164页ppt建模阐述XAI进展

专知

10+阅读 · 2022年8月25日

「博弈论视角下多智能体强化学习」研究综述

「博弈论视角下多智能体强化学习」研究综述

专知

57+阅读 · 2022年4月30日

复合型移动群智感知关键技术研究

国家自然科学基金

8+阅读 · 2017年12月31日

基于深度表达和迁移学习的人体检测研究

国家自然科学基金

6+阅读 · 2015年12月31日

基于自主学习的Ad hoc Agent序贯决策研究

国家自然科学基金

46+阅读 · 2015年12月31日

定位系统细胞启发的机器人情景认知地图构建与行为规划研究

国家自然科学基金

3+阅读 · 2015年12月31日

面向健康管理数据的关联型知识深度挖掘方法研究

国家自然科学基金

11+阅读 · 2015年12月31日

基于虚拟原型的信息物理融合系统高效可信构造研究

国家自然科学基金

7+阅读 · 2015年12月31日

基于记忆学习与免疫系统的仿生控制研究

国家自然科学基金

7+阅读 · 2015年12月31日

面向大数据的信息可视化设计方法研究

国家自然科学基金

6+阅读 · 2014年12月31日

癌症基因组中关键驱动突变信号通路的理论问题研究及算法设计

国家自然科学基金

0+阅读 · 2014年12月31日

基于融合先验知识的机器学习的多传感器融合研究

国家自然科学基金

16+阅读 · 2013年12月31日

Is ChatGPT a Good Recommender? A Preliminary Study

Arxiv

174+阅读 · 2023年4月20日

NeuralField-LDM: Scene Generation with Hierarchical Latent Diffusion Models

Arxiv

42+阅读 · 2023年4月19日

On Efficient Training of Large-Scale Deep Learning Models: A Literature Review

Arxiv

223+阅读 · 2023年4月7日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

493+阅读 · 2023年3月31日

Unleashing the Power of Edge-Cloud Generative AI in Mobile Networks: A Survey of AIGC Services

Arxiv

152+阅读 · 2023年3月29日

ChatGPT is a Knowledgeable but Inexperienced Solver: An Investigation of Commonsense Problem in Large Language Models

Arxiv

63+阅读 · 2023年3月29日

Knowledge Graphs: Opportunities and Challenges

Arxiv

177+阅读 · 2023年3月24日

Sparks of Artificial General Intelligence: Early experiments with GPT-4

Arxiv

51+阅读 · 2023年3月22日

A Complete Survey on Generative AI (AIGC): Is ChatGPT from GPT-4 to GPT-5 All You Need?

Arxiv

85+阅读 · 2023年3月21日

Data-centric Artificial Intelligence: A Survey

Arxiv

25+阅读 · 2023年3月17日

VIP会员

相关主题

鲁棒智能体

相关VIP内容

【牛津博士论文】面向视觉、物理与语言应用的可信机器学习模型

【牛津博士论文】面向视觉、物理与语言应用的可信机器学习模型

专知会员服务

17+阅读 · 10月5日

【CMU博士论文】以人为中心的强化学习

【CMU博士论文】以人为中心的强化学习

专知会员服务

21+阅读 · 8月16日

【CMU博士论文】基于课程学习的鲁棒强化学习

【CMU博士论文】基于课程学习的鲁棒强化学习

专知会员服务

19+阅读 · 3月27日

【ETZH博士论文】数据驱动的人工智能

【ETZH博士论文】数据驱动的人工智能

专知会员服务

37+阅读 · 2月21日

【CMU博士论文】构建通用机器人生成范式：基础设施、规模化与策略学习

【CMU博士论文】构建通用机器人生成范式：基础设施、规模化与策略学习

专知会员服务

22+阅读 · 2月9日

【CUHK博士论文】现代机器学习中的因果性学习

【CUHK博士论文】现代机器学习中的因果性学习

专知会员服务

35+阅读 · 1月24日

【CMU博士论文】使用数据不确定解释的可信学习

【CMU博士论文】使用数据不确定解释的可信学习

专知会员服务

28+阅读 · 2024年11月2日

【ETHZ博士论文】人工智能的鲁棒性和公平性的正式和统计认证

【ETHZ博士论文】人工智能的鲁棒性和公平性的正式和统计认证

专知会员服务

27+阅读 · 2024年10月11日

可解释AI《增加自主智能体透明度的用户直观解释》论文，雷神技术研究中心

可解释AI《增加自主智能体透明度的用户直观解释》论文，雷神技术研究中心

专知会员服务

47+阅读 · 2023年3月20日

【NUS博士论文】深度视觉算法的对抗鲁棒性研究

【NUS博士论文】深度视觉算法的对抗鲁棒性研究

专知会员服务

34+阅读 · 2022年11月25日

热门VIP内容

开通专知VIP会员享更多权益服务

【博士论文】面向开放式世界的鲁棒智能体

美空军如何利用人工智能提升其兵棋推演能力

【AAAI2026】NeSTR：一种用于大型语言模型的神经-符号可溯因框架，用于时间推理

深度强化学习与模仿学习导论

相关资讯

【斯坦福博士论文】将深度学习机器人学习扩展到广泛的现实世界数据，176页pdf

【斯坦福博士论文】将深度学习机器人学习扩展到广泛的现实世界数据，176页pdf

专知

12+阅读 · 2023年4月4日

推荐！【DARPA终身学习机器（L2M）】《自主系统中用于感知和行动的终身学习》美空军、宾大2022最新234页技术报告

推荐！【DARPA终身学习机器（L2M）】《自主系统中用于感知和行动的终身学习》美空军、宾大2022最新234页技术报告

专知

25+阅读 · 2022年11月24日

推荐！《用于兵棋推演和建模的人工智能》兰德、耶鲁大学2022最新16页论文

推荐！《用于兵棋推演和建模的人工智能》兰德、耶鲁大学2022最新16页论文

专知

52+阅读 · 2022年11月14日

《使用机器学习智能体设计基于模拟的空战飞行员训练系统》2022瑞典林雪平大学页论文

《使用机器学习智能体设计基于模拟的空战飞行员训练系统》2022瑞典林雪平大学页论文

专知

39+阅读 · 2022年10月30日

【伯克利博士论文】硬件感知的高效深度学习，154页pdf

【伯克利博士论文】硬件感知的高效深度学习，154页pdf

专知

10+阅读 · 2022年10月20日

【牛津大学博士论文】强化学习系统的数据高效部署，165页pdf

【牛津大学博士论文】强化学习系统的数据高效部署，165页pdf

专知

12+阅读 · 2022年10月15日

【牛津大学博士论文】深度强化学习的归纳偏差和泛化,168页pdf

【牛津大学博士论文】深度强化学习的归纳偏差和泛化,168页pdf

专知

10+阅读 · 2022年10月6日

《基于多智能体深度强化学习的空战模拟智能体协作》瑞典林雪平大学

《基于多智能体深度强化学习的空战模拟智能体协作》瑞典林雪平大学

专知

62+阅读 · 2022年8月25日

最新《可解释机器学习》报告，164页ppt建模阐述XAI进展

最新《可解释机器学习》报告，164页ppt建模阐述XAI进展

专知

10+阅读 · 2022年8月25日

「博弈论视角下多智能体强化学习」研究综述

「博弈论视角下多智能体强化学习」研究综述

专知

57+阅读 · 2022年4月30日

相关基金

复合型移动群智感知关键技术研究

国家自然科学基金

8+阅读 · 2017年12月31日

基于深度表达和迁移学习的人体检测研究

国家自然科学基金

6+阅读 · 2015年12月31日

基于自主学习的Ad hoc Agent序贯决策研究

国家自然科学基金

46+阅读 · 2015年12月31日

定位系统细胞启发的机器人情景认知地图构建与行为规划研究

国家自然科学基金

3+阅读 · 2015年12月31日

面向健康管理数据的关联型知识深度挖掘方法研究

国家自然科学基金

11+阅读 · 2015年12月31日

基于虚拟原型的信息物理融合系统高效可信构造研究

国家自然科学基金

7+阅读 · 2015年12月31日

基于记忆学习与免疫系统的仿生控制研究

国家自然科学基金

7+阅读 · 2015年12月31日

面向大数据的信息可视化设计方法研究

国家自然科学基金

6+阅读 · 2014年12月31日

癌症基因组中关键驱动突变信号通路的理论问题研究及算法设计

国家自然科学基金

0+阅读 · 2014年12月31日

基于融合先验知识的机器学习的多传感器融合研究

国家自然科学基金

16+阅读 · 2013年12月31日

相关论文

Is ChatGPT a Good Recommender? A Preliminary Study

Arxiv

174+阅读 · 2023年4月20日

NeuralField-LDM: Scene Generation with Hierarchical Latent Diffusion Models

Arxiv

42+阅读 · 2023年4月19日

On Efficient Training of Large-Scale Deep Learning Models: A Literature Review

Arxiv

223+阅读 · 2023年4月7日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

493+阅读 · 2023年3月31日

Unleashing the Power of Edge-Cloud Generative AI in Mobile Networks: A Survey of AIGC Services

Arxiv

152+阅读 · 2023年3月29日

ChatGPT is a Knowledgeable but Inexperienced Solver: An Investigation of Commonsense Problem in Large Language Models

Arxiv

63+阅读 · 2023年3月29日

Knowledge Graphs: Opportunities and Challenges

Arxiv

177+阅读 · 2023年3月24日

Sparks of Artificial General Intelligence: Early experiments with GPT-4

Arxiv

51+阅读 · 2023年3月22日

A Complete Survey on Generative AI (AIGC): Is ChatGPT from GPT-4 to GPT-5 All You Need?

Arxiv

85+阅读 · 2023年3月21日

Data-centric Artificial Intelligence: A Survey

Arxiv

25+阅读 · 2023年3月17日

微信扫码咨询专知VIP会员