强化学习(RL)是一种通过环境交互产生的奖励或惩罚信号驱动智能体决策的框架。深度强化学习整合深度学习与强化学习,利用深度神经网络处理高维复杂数据。依托该框架,机器学习研究界在长时序决策领域取得突破性进展,包括雅达利游戏超人类表现[Mnih et al., 2015]、围棋人机大战胜利[Silver et al., 2017]、以及鲁棒推荐系统构建[GomezUribe and Hunt, 2015, Singh et al., 2021]。本研究聚焦深度强化学习环境中的核心挑战,优化智能体策略以提升性能、样本效率与泛化能力。

论文第一部分针对单智能体稀疏奖励环境下的探索难题展开研究。当智能体仅在任务完成时获得反馈,传统方法常因探索不足而无法获取关键奖励,导致策略欠优。本文提出语义驱动探索新范式,显著提升稀疏奖励任务的样本效率与策略性能。第二部分延伸至协作式多智能体强化学习(MARL)领域,探究多智能体协同完成共享任务时的学习困境。在需严格协调且协调失误惩罚严苛的场景中,现有MARL方法常陷于次优均衡态;同时,智能体联合动作空间的维度爆炸式增长加剧探索难度。为此,本文创新提出通用价值探索框架与可扩展角色学习机制,有效促进智能体协调效率,加速联合动作空间探索,并赋予跨环境任务零样本泛化能力。此外,针对协作MARL中独立策略学习方法(各智能体视他者为环境要素)的研究表明,该方法在主流多智能体基准测试中性能优于现有联合学习范式。

本研究通过系统性创新,显著推进深度(多智能体)强化学习的前沿水平。所开发智能体具备高效环境探索能力,可攻克复杂多智能体协调任务,并在多任务场景展现卓越泛化性能。

成为VIP会员查看完整内容
13

相关内容

人工智能在军事中可用于多项任务,例如目标识别、大数据处理、作战系统、网络安全、后勤运输、战争医疗、威胁和安全监测以及战斗模拟和训练。
《可解释深度强化学习综述》
专知会员服务
38+阅读 · 2月12日
边缘人工智能的联邦持续学习:综合综述
专知会员服务
30+阅读 · 2024年12月14日
《面向多计算系统的人工智能自主决策》330页
专知会员服务
57+阅读 · 2024年11月21日
自动驾驶中的多智能体强化学习综述
专知会员服务
42+阅读 · 2024年8月20日
多智能体深度强化学习研究进展
专知会员服务
62+阅读 · 2024年7月17日
《多智能体强化学习策略优化算法设计》226页
专知会员服务
57+阅读 · 2024年6月9日
《多智能体强化学习:基础与现代方法》2023最新320页书稿
专知会员服务
122+阅读 · 2023年10月26日
MIT最新《贝叶斯深度学习》综述论文,37页pdf
专知会员服务
52+阅读 · 2021年1月4日
【MIT博士论文】数据高效强化学习,176页pdf
综述| 当图神经网络遇上强化学习
图与推荐
33+阅读 · 2022年7月1日
【KDD2020】图神经网络:基础与应用,322页ppt
多模态深度学习综述,18页pdf
专知
50+阅读 · 2020年3月29日
深度学习与计算机视觉任务应用综述
深度学习与NLP
50+阅读 · 2018年12月18日
国家自然科学基金
8+阅读 · 2017年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
8+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
11+阅读 · 2008年12月31日
A Survey of Large Language Models
Arxiv
448+阅读 · 2023年3月31日
Arxiv
10+阅读 · 2020年11月26日
VIP会员
相关VIP内容
《可解释深度强化学习综述》
专知会员服务
38+阅读 · 2月12日
边缘人工智能的联邦持续学习:综合综述
专知会员服务
30+阅读 · 2024年12月14日
《面向多计算系统的人工智能自主决策》330页
专知会员服务
57+阅读 · 2024年11月21日
自动驾驶中的多智能体强化学习综述
专知会员服务
42+阅读 · 2024年8月20日
多智能体深度强化学习研究进展
专知会员服务
62+阅读 · 2024年7月17日
《多智能体强化学习策略优化算法设计》226页
专知会员服务
57+阅读 · 2024年6月9日
《多智能体强化学习:基础与现代方法》2023最新320页书稿
专知会员服务
122+阅读 · 2023年10月26日
MIT最新《贝叶斯深度学习》综述论文,37页pdf
专知会员服务
52+阅读 · 2021年1月4日
相关基金
国家自然科学基金
8+阅读 · 2017年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
8+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
11+阅读 · 2008年12月31日
微信扫码咨询专知VIP会员