《资源分配博弈中的收敛率》 - 专知VIP

会员服务 ·

24

资源分配 · 博弈论 · AI与军事 ·

2023 年 3 月 10 日

《资源分配博弈中的收敛率》

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

如果纳什均衡与动态过程的长期结果相对应，它作为预测工具的有用性可能取决于向均衡的收敛率。本文通过实验测试了在智能体具有互补奖励的竞争之间分配资源情况下，关于收敛到平衡速率的理论预测。响应性更强的竞赛成功函数给了智能体更强的激励去做出最佳反应，但学习模型预测在响应性更强的成功函数下，由于智能体在均衡状态下面临奖励，导致向均衡状态的收敛速度更慢。与学习模型的预测一致，我们观察到在反应更强烈的成功函数下收敛的速度更慢，这表明非均衡奖励包含了在经验环境下收敛到均衡的速度有用信息。

成为VIP会员查看完整内容

41

相关内容

资源分配

【佐治亚理工博士论文】基于策略智能体和有限反馈的序列决策

【佐治亚理工博士论文】基于策略智能体和有限反馈的序列决策

专知会员服务

59+阅读 · 2023年4月12日

《综述：基于博弈论和机器学习的防御性欺骗方法》

《综述：基于博弈论和机器学习的防御性欺骗方法》

专知会员服务

51+阅读 · 2022年10月2日

【博士论文】《网络系统中安全资源分配的博弈论框架中行为决策效应》普渡大学2022最新论文

【博士论文】《网络系统中安全资源分配的博弈论框架中行为决策效应》普渡大学2022最新论文

专知会员服务

64+阅读 · 2022年9月22日

【经典书】《无记忆多智能体系统中的博弈论学习和分布式优化》176页pdf

【经典书】《无记忆多智能体系统中的博弈论学习和分布式优化》176页pdf

专知会员服务

53+阅读 · 2022年6月14日

《军事作战研究中的近似动态规划（强化学习）应用综述》加拿大国防研究与发展部、加拿大联合作战司令部

《军事作战研究中的近似动态规划（强化学习）应用综述》加拿大国防研究与发展部、加拿大联合作战司令部

专知会员服务

139+阅读 · 2022年5月17日

使用博弈论进行国防资源分配管理

使用博弈论进行国防资源分配管理

专知会员服务

84+阅读 · 2022年5月6日

【ICML2021】连续结构非平稳性中的深度强化学习

专知会员服务

15+阅读 · 2021年9月25日

【IJCAI2021】BESA: 基于BERT模拟退火算法的对抗性文本攻击

专知会员服务

14+阅读 · 2021年8月28日

[计算博弈论及其应用]，85页ppt

[计算博弈论及其应用]，85页ppt

专知会员服务

128+阅读 · 2021年7月21日

【ICML2021】为开放博弈中的学习建模行为多样性。

专知会员服务

37+阅读 · 2021年5月29日

用深度强化学习求解组合优化（路径、调度）问题

用深度强化学习求解组合优化（路径、调度）问题

PaperWeekly

4+阅读 · 2022年10月18日

【博士论文】《安全博弈中的分层规划：战略、战术和行动决策的博弈论方法》南加州大学

【博士论文】《安全博弈中的分层规划：战略、战术和行动决策的博弈论方法》南加州大学

专知

24+阅读 · 2022年9月25日

【博士论文】《网络系统中安全资源分配的博弈论框架中行为决策效应》2022最新论文

【博士论文】《网络系统中安全资源分配的博弈论框架中行为决策效应》2022最新论文

专知

5+阅读 · 2022年9月23日

【ICML2022】公平的因果概念及其后果

【ICML2022】公平的因果概念及其后果

专知

3+阅读 · 2022年7月13日

AI来搞财富分配比人更公平？来自DeepMind的多人博弈游戏研究

AI来搞财富分配比人更公平？来自DeepMind的多人博弈游戏研究

量子位

0+阅读 · 2022年7月7日

DeepMind：用PopArt进行多任务深度强化学习

DeepMind：用PopArt进行多任务深度强化学习

论智

29+阅读 · 2018年9月14日

论强化学习的根本缺陷

论强化学习的根本缺陷

AI科技评论

11+阅读 · 2018年7月24日

资源 | 跟着Sutton经典教材学强化学习中的蒙特卡罗方法（代码实例）

资源 | 跟着Sutton经典教材学强化学习中的蒙特卡罗方法（代码实例）

大数据文摘

11+阅读 · 2018年6月12日

不对称多代理博弈中的博弈理论解读

不对称多代理博弈中的博弈理论解读

AI前线

14+阅读 · 2018年3月8日

资源 | 一文读懂深度学习（附学习资源）

资源 | 一文读懂深度学习（附学习资源）

AI100

14+阅读 · 2017年11月30日

基于鲁棒非合作博弈的飞蜂窝网络资源分配与干扰管理

国家自然科学基金

1+阅读 · 2014年12月31日

分布式优化算法及其隐私保护策略研究

国家自然科学基金

2+阅读 · 2013年12月31日

合作、绿色的异构无线网络的自适应资源分配

国家自然科学基金

0+阅读 · 2013年12月31日

复杂无线环境中频谱资源的协同感知和动态分配技术

国家自然科学基金

1+阅读 · 2013年12月31日

多信道MANETs网络并发传输资源分配理论与方法研究

国家自然科学基金

0+阅读 · 2012年12月31日

基于资源分配的调度管理研究

国家自然科学基金

2+阅读 · 2012年12月31日

基于博弈论的认知无线网络资源分配机制研究

国家自然科学基金

3+阅读 · 2011年12月31日

基于风险偏好的模糊博弈及宁夏煤炭资源开发与环境保护最优策略研究

国家自然科学基金

1+阅读 · 2011年12月31日

基于控制论和矩阵摄动理论的认知无线电系统动态资源分配问题研究

国家自然科学基金

0+阅读 · 2011年12月31日

基于有限理性分析的资源寡头博弈系统动力学研究

国家自然科学基金

1+阅读 · 2011年12月31日

Projection-Free Online Convex Optimization with Stochastic Constraints

Arxiv

0+阅读 · 2023年5月2日

Conditionally Elicitable Dynamic Risk Measures for Deep Reinforcement Learning

Arxiv

0+阅读 · 2023年5月1日

On the Complexity of Multi-Agent Decision Making: From Learning in Games to Partial Monitoring

Arxiv

2+阅读 · 2023年5月1日

Posterior Sampling for Deep Reinforcement Learning

Arxiv

0+阅读 · 2023年4月30日

Bandit Social Learning: Exploration under Myopic Behavior

Arxiv

0+阅读 · 2023年4月28日

MASK-CNN-Transformer For Real-Time Multi-Label Weather Recognition

Arxiv

0+阅读 · 2023年4月28日

Mastering the Game of Stratego with Model-Free Multiagent Reinforcement Learning

Arxiv

34+阅读 · 2022年6月30日

已删除

Arxiv

32+阅读 · 2020年3月23日

The Book of Why: Review

Arxiv

15+阅读 · 2019年9月30日

Deep Semantic Role Labeling with Self-Attention

Arxiv

13+阅读 · 2017年12月5日

VIP会员

相关主题

相关VIP内容

【佐治亚理工博士论文】基于策略智能体和有限反馈的序列决策

【佐治亚理工博士论文】基于策略智能体和有限反馈的序列决策

专知会员服务

59+阅读 · 2023年4月12日

《综述：基于博弈论和机器学习的防御性欺骗方法》

《综述：基于博弈论和机器学习的防御性欺骗方法》

专知会员服务

51+阅读 · 2022年10月2日

【博士论文】《网络系统中安全资源分配的博弈论框架中行为决策效应》普渡大学2022最新论文

【博士论文】《网络系统中安全资源分配的博弈论框架中行为决策效应》普渡大学2022最新论文

专知会员服务

64+阅读 · 2022年9月22日

【经典书】《无记忆多智能体系统中的博弈论学习和分布式优化》176页pdf

【经典书】《无记忆多智能体系统中的博弈论学习和分布式优化》176页pdf

专知会员服务

53+阅读 · 2022年6月14日

《军事作战研究中的近似动态规划（强化学习）应用综述》加拿大国防研究与发展部、加拿大联合作战司令部

《军事作战研究中的近似动态规划（强化学习）应用综述》加拿大国防研究与发展部、加拿大联合作战司令部

专知会员服务

139+阅读 · 2022年5月17日

使用博弈论进行国防资源分配管理

使用博弈论进行国防资源分配管理

专知会员服务

84+阅读 · 2022年5月6日

【ICML2021】连续结构非平稳性中的深度强化学习

专知会员服务

15+阅读 · 2021年9月25日

【IJCAI2021】BESA: 基于BERT模拟退火算法的对抗性文本攻击

专知会员服务

14+阅读 · 2021年8月28日

[计算博弈论及其应用]，85页ppt

[计算博弈论及其应用]，85页ppt

专知会员服务

128+阅读 · 2021年7月21日

【ICML2021】为开放博弈中的学习建模行为多样性。

专知会员服务

37+阅读 · 2021年5月29日

热门VIP内容

开通专知VIP会员享更多权益服务

《攻击场景描述形式化模型研究》

【博士论文】理解神经网络的训练动态：从局部优化轨迹与特征学习视角

《战区安全决策课程体系》最新244页

《"无人机航母"原型平台》

相关资讯

用深度强化学习求解组合优化（路径、调度）问题

用深度强化学习求解组合优化（路径、调度）问题

PaperWeekly

4+阅读 · 2022年10月18日

【博士论文】《安全博弈中的分层规划：战略、战术和行动决策的博弈论方法》南加州大学

【博士论文】《安全博弈中的分层规划：战略、战术和行动决策的博弈论方法》南加州大学

专知

24+阅读 · 2022年9月25日

【博士论文】《网络系统中安全资源分配的博弈论框架中行为决策效应》2022最新论文

【博士论文】《网络系统中安全资源分配的博弈论框架中行为决策效应》2022最新论文

专知

5+阅读 · 2022年9月23日

【ICML2022】公平的因果概念及其后果

【ICML2022】公平的因果概念及其后果

专知

3+阅读 · 2022年7月13日

AI来搞财富分配比人更公平？来自DeepMind的多人博弈游戏研究

AI来搞财富分配比人更公平？来自DeepMind的多人博弈游戏研究

量子位

0+阅读 · 2022年7月7日

DeepMind：用PopArt进行多任务深度强化学习

DeepMind：用PopArt进行多任务深度强化学习

论智

29+阅读 · 2018年9月14日

论强化学习的根本缺陷

论强化学习的根本缺陷

AI科技评论

11+阅读 · 2018年7月24日

资源 | 跟着Sutton经典教材学强化学习中的蒙特卡罗方法（代码实例）

资源 | 跟着Sutton经典教材学强化学习中的蒙特卡罗方法（代码实例）

大数据文摘

11+阅读 · 2018年6月12日

不对称多代理博弈中的博弈理论解读

不对称多代理博弈中的博弈理论解读

AI前线

14+阅读 · 2018年3月8日

资源 | 一文读懂深度学习（附学习资源）

资源 | 一文读懂深度学习（附学习资源）

AI100

14+阅读 · 2017年11月30日

相关基金

基于鲁棒非合作博弈的飞蜂窝网络资源分配与干扰管理

国家自然科学基金

1+阅读 · 2014年12月31日

分布式优化算法及其隐私保护策略研究

国家自然科学基金

2+阅读 · 2013年12月31日

合作、绿色的异构无线网络的自适应资源分配

国家自然科学基金

0+阅读 · 2013年12月31日

复杂无线环境中频谱资源的协同感知和动态分配技术

国家自然科学基金

1+阅读 · 2013年12月31日

多信道MANETs网络并发传输资源分配理论与方法研究

国家自然科学基金

0+阅读 · 2012年12月31日

基于资源分配的调度管理研究

国家自然科学基金

2+阅读 · 2012年12月31日

基于博弈论的认知无线网络资源分配机制研究

国家自然科学基金

3+阅读 · 2011年12月31日

基于风险偏好的模糊博弈及宁夏煤炭资源开发与环境保护最优策略研究

国家自然科学基金

1+阅读 · 2011年12月31日

基于控制论和矩阵摄动理论的认知无线电系统动态资源分配问题研究

国家自然科学基金

0+阅读 · 2011年12月31日

基于有限理性分析的资源寡头博弈系统动力学研究

国家自然科学基金

1+阅读 · 2011年12月31日

相关论文

Projection-Free Online Convex Optimization with Stochastic Constraints

Arxiv

0+阅读 · 2023年5月2日

Conditionally Elicitable Dynamic Risk Measures for Deep Reinforcement Learning

Arxiv

0+阅读 · 2023年5月1日

On the Complexity of Multi-Agent Decision Making: From Learning in Games to Partial Monitoring

Arxiv

2+阅读 · 2023年5月1日

Posterior Sampling for Deep Reinforcement Learning

Arxiv

0+阅读 · 2023年4月30日

Bandit Social Learning: Exploration under Myopic Behavior

Arxiv

0+阅读 · 2023年4月28日

MASK-CNN-Transformer For Real-Time Multi-Label Weather Recognition

Arxiv

0+阅读 · 2023年4月28日

Mastering the Game of Stratego with Model-Free Multiagent Reinforcement Learning

Arxiv

34+阅读 · 2022年6月30日

已删除

Arxiv

32+阅读 · 2020年3月23日

The Book of Why: Review

Arxiv

15+阅读 · 2019年9月30日

Deep Semantic Role Labeling with Self-Attention

Arxiv

13+阅读 · 2017年12月5日

微信扫码咨询专知VIP会员