强化学习(RL)为自主智能体提供了广阔前景,但在安全关键领域部署机器人系统时,必须确保其具备足够的鲁棒性以应对现实场景。具体而言,机器人应能够:适应可能遭遇的各类环境变化避免进入不可逆的危险状态(如碰撞障碍物)即使主要目标无法达成,仍需满足基本安全要求传统提升RL智能体鲁棒性的方法是通过领域随机化探索多样化的场景、环境参数与对抗策略。但随着智能体性能提升,其主动探索低效区域的可能性反而降低。对抗训练通过对抗智能体注入噪声迫使主智能体暴露弱点,但该方法存在两个缺陷:对抗智能体极易占据优势,主智能体需专家监督才能克服噪声非结构化环境中,环境因素对状态空间分布的影响远超噪声编码能力本论文将探讨如何运用课程学习帮助智能体高效探索多样化情境、对手策略及动力学模型,最终实现鲁棒性能。论文结构如下:课程学习基础:阐释如何利用课程学习实现广谱环境探索多智能体扩展:研究课程学习在协作/竞争、对称/非对称场景中的鲁棒策略发现机制质量多样性拓展:探索课程学习构建行为库的可行性,通过累积行为多样性实现系统级鲁棒性。

成为VIP会员查看完整内容
13

相关内容

博士论文是由攻读博士学位的研究生所撰写的学术论文。它要求作者在博士生导师的指导下,选择自己能够把握和驾驭的潜在的研究方向,开辟新的研究领域。由此可见,这就对作者提出了较高要求,它要求作者必须在本学科的专业领域具备大量的理论知识,并对所学专业的理论知识有相当深入的理解和思考,同时还要具有相当水平的独立科学研究能力,能够为在学科领域提出独创性的见解和有价值的科研成果。因而,较之学士论文、硕士论文,博士论文具有更高的学术价值,对学科的发展具有重要的推动作用。
【NUS博士论文】视频语义理解的因果模型
专知会员服务
8+阅读 · 3月19日
【CUHK博士论文】现代机器学习中的因果性学习
专知会员服务
30+阅读 · 1月24日
【CMU博士论文】通过课程学习实现鲁棒的强化学习
专知会员服务
24+阅读 · 2024年12月15日
【伯克利博士论文】开放世界机器人之基础模型路径
专知会员服务
36+阅读 · 2024年8月13日
【UFPE大学博士论文】基于熵损失的鲁棒深度学习
专知会员服务
42+阅读 · 2022年11月11日
【CMU博士论文】通过记忆的元强化学习
专知会员服务
54+阅读 · 2021年10月16日
「基于通信的多智能体强化学习」 进展综述
基于模型的强化学习综述
专知
36+阅读 · 2022年7月13日
「强化学习可解释性」最新2022综述
专知
11+阅读 · 2022年1月16日
【KDD2020】动态知识图谱的多事件预测
专知
88+阅读 · 2020年8月31日
【KDD2020】图神经网络生成式预训练
专知
22+阅读 · 2020年7月3日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
42+阅读 · 2015年12月31日
国家自然科学基金
7+阅读 · 2015年12月31日
国家自然科学基金
7+阅读 · 2015年12月31日
国家自然科学基金
10+阅读 · 2013年12月31日
国家自然科学基金
15+阅读 · 2013年12月31日
Arxiv
165+阅读 · 2023年4月20日
A Survey of Large Language Models
Arxiv
447+阅读 · 2023年3月31日
Arxiv
162+阅读 · 2023年3月24日
Arxiv
23+阅读 · 2023年3月17日
VIP会员
相关VIP内容
【NUS博士论文】视频语义理解的因果模型
专知会员服务
8+阅读 · 3月19日
【CUHK博士论文】现代机器学习中的因果性学习
专知会员服务
30+阅读 · 1月24日
【CMU博士论文】通过课程学习实现鲁棒的强化学习
专知会员服务
24+阅读 · 2024年12月15日
【伯克利博士论文】开放世界机器人之基础模型路径
专知会员服务
36+阅读 · 2024年8月13日
【UFPE大学博士论文】基于熵损失的鲁棒深度学习
专知会员服务
42+阅读 · 2022年11月11日
【CMU博士论文】通过记忆的元强化学习
专知会员服务
54+阅读 · 2021年10月16日
相关基金
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
42+阅读 · 2015年12月31日
国家自然科学基金
7+阅读 · 2015年12月31日
国家自然科学基金
7+阅读 · 2015年12月31日
国家自然科学基金
10+阅读 · 2013年12月31日
国家自然科学基金
15+阅读 · 2013年12月31日
微信扫码咨询专知VIP会员