序列决策是机器学习应用的一种自然模型,学习器必须实时进行在线决策,同时从序列数据中学习,以便在未来做出更好的决策。经典工作专注于基于随机或对抗性数据分布的问题变体,或基于对学习器决策的反馈,这些决策可能是部分的或完整的。随着大型在线市场的迅速崛起,序列学习方法越来越多地部署在复杂的多智能体系统中,智能体可以根据自己的个人目标进行战略性优化。这为序列决策问题增加了一个新的维度,在这个维度中,学习器必须考虑到它正在学习的智能体的战略行为,这些智能体可能希望引导其未来的决策朝着有利于自己的方向发展。本文旨在从系统设计者的角度设计有效的在线决策算法,系统设计者的目标是在具有有限反馈的战略智能体环境中学习,以及战略智能体的目标是优化个人目标

在论文的第一部分中,我们专注于重复拍卖,并设计了拍卖者可以在战略投标人存在的情况下有效学习的机制,反之,解决智能体如何在重复拍卖中投标或使用数据中毒攻击来最大化他们自己的目标。在第二部分中,我们考虑在线学习环境,其中关于学习者决策的反馈是昂贵的。本文提出一种在线学习算法,受主动学习技术的启发,可以快速前进队列中信息量更大的一小部分示例。这允许学习器获得与最优在线算法相同的性能,但仅通过查询非常小的分数的反馈。最后,在论文的第三部分,我们考虑了一个新的随机多臂匪徒学习目标,它促进了个人和群体机会的择优公平。https://smartech.gatech.edu/handle/1853/70199

成为VIP会员查看完整内容
54

相关内容

博士论文是由攻读博士学位的研究生所撰写的学术论文。它要求作者在博士生导师的指导下,选择自己能够把握和驾驭的潜在的研究方向,开辟新的研究领域。由此可见,这就对作者提出了较高要求,它要求作者必须在本学科的专业领域具备大量的理论知识,并对所学专业的理论知识有相当深入的理解和思考,同时还要具有相当水平的独立科学研究能力,能够为在学科领域提出独创性的见解和有价值的科研成果。因而,较之学士论文、硕士论文,博士论文具有更高的学术价值,对学科的发展具有重要的推动作用。
《分布式多智能体深度强化学习:竞争性博弈》最新论文
专知会员服务
125+阅读 · 2023年3月16日
【UIUC博士论文】高效多智能体深度强化学习,130页pdf
专知会员服务
71+阅读 · 2023年1月14日
【博士论文】弱反馈的序列决策问题
专知会员服务
22+阅读 · 2023年1月2日
【CMU博士论文】黑盒和多目标优化策略,151页pdf
专知会员服务
51+阅读 · 2022年11月24日
《多智能体任务规划》2022博士论文
专知会员服务
270+阅读 · 2022年11月20日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
4+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2008年12月31日
Arxiv
31+阅读 · 2023年1月8日
已删除
Arxiv
32+阅读 · 2020年3月23日
Arxiv
38+阅读 · 2020年3月10日
Arxiv
92+阅读 · 2020年2月28日
VIP会员
相关VIP内容
《分布式多智能体深度强化学习:竞争性博弈》最新论文
专知会员服务
125+阅读 · 2023年3月16日
【UIUC博士论文】高效多智能体深度强化学习,130页pdf
专知会员服务
71+阅读 · 2023年1月14日
【博士论文】弱反馈的序列决策问题
专知会员服务
22+阅读 · 2023年1月2日
【CMU博士论文】黑盒和多目标优化策略,151页pdf
专知会员服务
51+阅读 · 2022年11月24日
《多智能体任务规划》2022博士论文
专知会员服务
270+阅读 · 2022年11月20日
相关基金
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
4+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2008年12月31日
微信扫码咨询专知VIP会员