《自适应游戏智能体算法》258页博士论文，哥本哈根信息技术大学 - 专知VIP

会员服务 ·

43

智能体 · 哥本哈根信息技术大学 · 博士论文 · AI与军事 ·

2022 年 11 月 29 日

《自适应游戏智能体算法》258页博士论文，哥本哈根信息技术大学

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

多年来，有几个游戏被研究人员作为人工智能（AI）研究领域的关键挑战来推广，其最终目标是在这些游戏中击败最好的人类玩家。深度学习的最新发展使计算机能够为许多游戏学习强大的策略，而以前的方法在这方面却有所欠缺。然而，最复杂的游戏，如实时战略（RTS）游戏《星际争霸》（Blizzard Entertainment, 1998），仍然没有被人工智能所掌握。我们确定了自适应的三个属性，我们认为这是用人工智能完全掌握最难的游戏所需要的。这些属性是 (1)游戏内自适应：在游戏内适应对手策略的能力，(2)游戏间自适应：在游戏间智能地转换策略的能力，以及(3)通用性：对许多不同的，而且很可能是未见过的变化（如不同等级）进行概括的能力。我们分析了最先进的游戏算法在适应性方面的缺点，并提出了针对每个属性的新算法方法。其中一些方法还试图克服在奖励稀少的游戏中学习适应性策略的困难。本论文的主要贡献是 (a) 在《星际争霸》中执行在线自适应构建顺序规划的持续进化规划算法，(b) 在《星际争霸》中的游戏内自适应构建顺序规划的模仿学习方法，产生了第一个（据我们所知）基于神经网络的机器人，可以玩完整个游戏，(c) 从演示中学习行为重排的新型模仿学习方法，(d) 一种用于强化学习的自动奖励塑造技术，该技术根据预先定义的事件的时间稀有性自动分配反馈值，作为一种课程学习和正则化技术的形式，在奖励稀少的游戏中避免过度适应的行为，(e) 一个新的强化学习框架，它结合了程序性内容生成，每集产生新的训练水平，随着智能体的改进，难度逐渐增加，这被证明可以克服稀疏的奖励，并增加学习策略的通用性，(f) 一种评估人类和人工智能之间游戏竞赛公平性的实用方法，进一步强调了适应的重要性，以及(g) 一个新的人工智能挑战和竞赛，是基于棋盘游戏，它比围棋复杂得多，需要高水平的通用性。这些贡献为玩复杂游戏的人工智能挑战带来了一个新的视角，其重点在于适应。我们相信这一观点对于实现强大而稳健的游戏AI至关重要。我们的贡献有可能对游戏之外的许多重要的现实世界问题产生影响，例如在不断变化的环境中的机器人任务，以及需要高度适应性的复杂互动。

成为VIP会员查看完整内容

63

相关内容

智能体

智能体，顾名思义，就是具有智能的实体，英文名是Agent。

《面向人工智能军事行动的联邦自动元集成学习框架》2023最新17页论文

《面向人工智能军事行动的联邦自动元集成学习框架》2023最新17页论文

专知会员服务

55+阅读 · 2023年2月1日

【CMU博士论文】解决现代强化学习中的挑战: 长规划时界，大状态空间，175页pdf

【CMU博士论文】解决现代强化学习中的挑战: 长规划时界，大状态空间，175页pdf

专知会员服务

54+阅读 · 2023年1月4日

中科院自动化所最新《分布式深度强化学习DDRL》综述，14页pdf阐述DDRL与多玩家多智能体学习工具箱

中科院自动化所最新《分布式深度强化学习DDRL》综述，14页pdf阐述DDRL与多玩家多智能体学习工具箱

专知会员服务

41+阅读 · 2022年12月2日

《移动目标的搜索模型》【潜艇】美国海军研究生院2022最新70页论文

《移动目标的搜索模型》【潜艇】美国海军研究生院2022最新70页论文

专知会员服务

45+阅读 · 2022年10月26日

【牛津大学博士论文】元强化学习的快速自适应，217页pdf

【牛津大学博士论文】元强化学习的快速自适应，217页pdf

专知会员服务

104+阅读 · 2022年9月19日

190页pdf伯克利博士论文《自适应持续的具身智能体》，系统全面阐述机器人技术

190页pdf伯克利博士论文《自适应持续的具身智能体》，系统全面阐述机器人技术

专知会员服务

70+阅读 · 2022年8月29日

推荐！《医疗保健中强化学习的离策略评估》哈佛大学181页博士论文

推荐！《医疗保健中强化学习的离策略评估》哈佛大学181页博士论文

专知会员服务

27+阅读 · 2022年7月21日

【CMU博士论文】通过记忆的元强化学习，118页pdf

【CMU博士论文】通过记忆的元强化学习，118页pdf

专知会员服务

48+阅读 · 2022年6月23日

【CMU-zhanghao博士论文】并行机器学习：自适应、可组合与自动化，附229页pdf与答辩视频

【CMU-zhanghao博士论文】并行机器学习：自适应、可组合与自动化，附229页pdf与答辩视频

专知会员服务

50+阅读 · 2020年10月18日

【CMU博士论文Wen Sun】强化学习的泛化性与效率，206页pdf

【CMU博士论文Wen Sun】强化学习的泛化性与效率，206页pdf

专知会员服务

93+阅读 · 2020年9月28日

【牛津大学博士论文】深度强化学习的归纳偏差和泛化,168页pdf

【牛津大学博士论文】深度强化学习的归纳偏差和泛化,168页pdf

专知

10+阅读 · 2022年10月6日

【博士论文】《多Agent系统中的突现行为开发和控制》美国空军技术学院195页

【博士论文】《多Agent系统中的突现行为开发和控制》美国空军技术学院195页

专知

4+阅读 · 2022年9月27日

【牛津大学博士论文】元强化学习的快速自适应，217页pdf

【牛津大学博士论文】元强化学习的快速自适应，217页pdf

专知

29+阅读 · 2022年9月19日

190页pdf伯克利博士论文《自适应持续的具身智能体》，系统全面阐述机器人技术

190页pdf伯克利博士论文《自适应持续的具身智能体》，系统全面阐述机器人技术

专知

3+阅读 · 2022年8月29日

301页pdf伯克利博士论文《可扩展机器人学习》，系统全面阐述机器人技术

301页pdf伯克利博士论文《可扩展机器人学习》，系统全面阐述机器人技术

专知

7+阅读 · 2022年8月16日

《通过近似动态规划解决具有动态目标到达的多Agent路由问题》美国空军大学130页学位论文

《通过近似动态规划解决具有动态目标到达的多Agent路由问题》美国空军大学130页学位论文

专知

13+阅读 · 2022年7月22日

【新书】分布式强化学习，280页pdf

【新书】分布式强化学习，280页pdf

专知

22+阅读 · 2021年12月19日

DeepMind：用PopArt进行多任务深度强化学习

DeepMind：用PopArt进行多任务深度强化学习

论智

29+阅读 · 2018年9月14日

论强化学习的根本缺陷

论强化学习的根本缺陷

AI科技评论

11+阅读 · 2018年7月24日

「元学习」解析：学习如何梯度下降与学习新的算法

「元学习」解析：学习如何梯度下降与学习新的算法

AI研习社

12+阅读 · 2018年5月1日

基于近似动态规划的数据驱动非线性多输入多输出在线优化与控制算法

国家自然科学基金

1+阅读 · 2013年12月31日

时变环境下基于人类记忆机制的长期SLAM技术研究

国家自然科学基金

1+阅读 · 2013年12月31日

Markov决策过程值函数逼近的基函数自动构造

国家自然科学基金

1+阅读 · 2012年12月31日

组合优化问题的组合：问题、算法和复杂性

国家自然科学基金

5+阅读 · 2012年12月31日

基于学习人类策略的动态稳定系统控制器切换方法研究

国家自然科学基金

2+阅读 · 2012年12月31日

基于自适应约束传播的约束求解方法研究

国家自然科学基金

0+阅读 · 2011年12月31日

针对环境变量不确定性的进化鲁棒优化算法

国家自然科学基金

0+阅读 · 2011年12月31日

基于案例推理和进化神经网络技术的计算机游戏智能水平研究

国家自然科学基金

2+阅读 · 2009年12月31日

基于多智能体强化学习的多机器人系统研究

国家自然科学基金

48+阅读 · 2009年12月31日

基于自适应动态规划的波形优化方法及在雷达通信中的应用

国家自然科学基金

2+阅读 · 2008年12月31日

An order out of nowhere: a new algorithm for infinite-domain CSPs

Arxiv

0+阅读 · 2023年1月30日

Machine-learning-aided Massive Hybrid Analog and Digital MIMO DOA Estimation for Future Wireless Networks

Arxiv

0+阅读 · 2023年1月28日

(Private) Kernelized Bandits with Distributed Biased Feedback

Arxiv

0+阅读 · 2023年1月28日

Improving deep learning precipitation nowcasting by using prior knowledge

Arxiv

0+阅读 · 2023年1月27日

Octupoles for octahedral symmetry

Arxiv

0+阅读 · 2023年1月23日

Pretraining in Deep Reinforcement Learning: A Survey

Arxiv

21+阅读 · 2022年11月8日

Geometric Deep Learning on Molecular Representations

Arxiv

12+阅读 · 2021年7月26日

Deep learning: a statistical viewpoint

Arxiv

18+阅读 · 2021年3月16日

CURL: Contrastive Unsupervised Representations for Reinforcement Learning

Arxiv

17+阅读 · 2020年4月28日

Optimization for deep learning: theory and algorithms

Optimization for deep learning: theory and algorithms

Arxiv

106+阅读 · 2019年12月19日

VIP会员

相关主题

哥本哈根信息技术大学

相关VIP内容

《面向人工智能军事行动的联邦自动元集成学习框架》2023最新17页论文

《面向人工智能军事行动的联邦自动元集成学习框架》2023最新17页论文

专知会员服务

55+阅读 · 2023年2月1日

【CMU博士论文】解决现代强化学习中的挑战: 长规划时界，大状态空间，175页pdf

【CMU博士论文】解决现代强化学习中的挑战: 长规划时界，大状态空间，175页pdf

专知会员服务

54+阅读 · 2023年1月4日

中科院自动化所最新《分布式深度强化学习DDRL》综述，14页pdf阐述DDRL与多玩家多智能体学习工具箱

中科院自动化所最新《分布式深度强化学习DDRL》综述，14页pdf阐述DDRL与多玩家多智能体学习工具箱

专知会员服务

41+阅读 · 2022年12月2日

《移动目标的搜索模型》【潜艇】美国海军研究生院2022最新70页论文

《移动目标的搜索模型》【潜艇】美国海军研究生院2022最新70页论文

专知会员服务

45+阅读 · 2022年10月26日

【牛津大学博士论文】元强化学习的快速自适应，217页pdf

【牛津大学博士论文】元强化学习的快速自适应，217页pdf

专知会员服务

104+阅读 · 2022年9月19日

190页pdf伯克利博士论文《自适应持续的具身智能体》，系统全面阐述机器人技术

190页pdf伯克利博士论文《自适应持续的具身智能体》，系统全面阐述机器人技术

专知会员服务

70+阅读 · 2022年8月29日

推荐！《医疗保健中强化学习的离策略评估》哈佛大学181页博士论文

推荐！《医疗保健中强化学习的离策略评估》哈佛大学181页博士论文

专知会员服务

27+阅读 · 2022年7月21日

【CMU博士论文】通过记忆的元强化学习，118页pdf

【CMU博士论文】通过记忆的元强化学习，118页pdf

专知会员服务

48+阅读 · 2022年6月23日

【CMU-zhanghao博士论文】并行机器学习：自适应、可组合与自动化，附229页pdf与答辩视频

【CMU-zhanghao博士论文】并行机器学习：自适应、可组合与自动化，附229页pdf与答辩视频

专知会员服务

50+阅读 · 2020年10月18日

【CMU博士论文Wen Sun】强化学习的泛化性与效率，206页pdf

【CMU博士论文Wen Sun】强化学习的泛化性与效率，206页pdf

专知会员服务

93+阅读 · 2020年9月28日

热门VIP内容

开通专知VIP会员享更多权益服务

【博士论文】扩展可扩展会话推荐的边界

别想太多：高效 R1 风格大型推理模型综述

【ACMMM2025】EvoVLMA: 进化式视觉-语言模型自适应

智能体网络：用AI智能体编织下一代网络

相关资讯

【牛津大学博士论文】深度强化学习的归纳偏差和泛化,168页pdf

【牛津大学博士论文】深度强化学习的归纳偏差和泛化,168页pdf

专知

10+阅读 · 2022年10月6日

【博士论文】《多Agent系统中的突现行为开发和控制》美国空军技术学院195页

【博士论文】《多Agent系统中的突现行为开发和控制》美国空军技术学院195页

专知

4+阅读 · 2022年9月27日

【牛津大学博士论文】元强化学习的快速自适应，217页pdf

【牛津大学博士论文】元强化学习的快速自适应，217页pdf

专知

29+阅读 · 2022年9月19日

190页pdf伯克利博士论文《自适应持续的具身智能体》，系统全面阐述机器人技术

190页pdf伯克利博士论文《自适应持续的具身智能体》，系统全面阐述机器人技术

专知

3+阅读 · 2022年8月29日

301页pdf伯克利博士论文《可扩展机器人学习》，系统全面阐述机器人技术

301页pdf伯克利博士论文《可扩展机器人学习》，系统全面阐述机器人技术

专知

7+阅读 · 2022年8月16日

《通过近似动态规划解决具有动态目标到达的多Agent路由问题》美国空军大学130页学位论文

《通过近似动态规划解决具有动态目标到达的多Agent路由问题》美国空军大学130页学位论文

专知

13+阅读 · 2022年7月22日

【新书】分布式强化学习，280页pdf

【新书】分布式强化学习，280页pdf

专知

22+阅读 · 2021年12月19日

DeepMind：用PopArt进行多任务深度强化学习

DeepMind：用PopArt进行多任务深度强化学习

论智

29+阅读 · 2018年9月14日

论强化学习的根本缺陷

论强化学习的根本缺陷

AI科技评论

11+阅读 · 2018年7月24日

「元学习」解析：学习如何梯度下降与学习新的算法

「元学习」解析：学习如何梯度下降与学习新的算法

AI研习社

12+阅读 · 2018年5月1日

相关基金

基于近似动态规划的数据驱动非线性多输入多输出在线优化与控制算法

国家自然科学基金

1+阅读 · 2013年12月31日

时变环境下基于人类记忆机制的长期SLAM技术研究

国家自然科学基金

1+阅读 · 2013年12月31日

Markov决策过程值函数逼近的基函数自动构造

国家自然科学基金

1+阅读 · 2012年12月31日

组合优化问题的组合：问题、算法和复杂性

国家自然科学基金

5+阅读 · 2012年12月31日

基于学习人类策略的动态稳定系统控制器切换方法研究

国家自然科学基金

2+阅读 · 2012年12月31日

基于自适应约束传播的约束求解方法研究

国家自然科学基金

0+阅读 · 2011年12月31日

针对环境变量不确定性的进化鲁棒优化算法

国家自然科学基金

0+阅读 · 2011年12月31日

基于案例推理和进化神经网络技术的计算机游戏智能水平研究

国家自然科学基金

2+阅读 · 2009年12月31日

基于多智能体强化学习的多机器人系统研究

国家自然科学基金

48+阅读 · 2009年12月31日

基于自适应动态规划的波形优化方法及在雷达通信中的应用

国家自然科学基金

2+阅读 · 2008年12月31日

相关论文

An order out of nowhere: a new algorithm for infinite-domain CSPs

Arxiv

0+阅读 · 2023年1月30日

Machine-learning-aided Massive Hybrid Analog and Digital MIMO DOA Estimation for Future Wireless Networks

Arxiv

0+阅读 · 2023年1月28日

(Private) Kernelized Bandits with Distributed Biased Feedback

Arxiv

0+阅读 · 2023年1月28日

Improving deep learning precipitation nowcasting by using prior knowledge

Arxiv

0+阅读 · 2023年1月27日

Octupoles for octahedral symmetry

Arxiv

0+阅读 · 2023年1月23日

Pretraining in Deep Reinforcement Learning: A Survey

Arxiv

21+阅读 · 2022年11月8日

Geometric Deep Learning on Molecular Representations

Arxiv

12+阅读 · 2021年7月26日

Deep learning: a statistical viewpoint

Arxiv

18+阅读 · 2021年3月16日

CURL: Contrastive Unsupervised Representations for Reinforcement Learning

Arxiv

17+阅读 · 2020年4月28日

Optimization for deep learning: theory and algorithms

Optimization for deep learning: theory and algorithms

Arxiv

106+阅读 · 2019年12月19日

微信扫码咨询专知VIP会员