多边代理在线优化与延迟:非同步性、适应性和乐观主义 (Multi-Agent Online Optimization with Delays: Asynchronicity, Adaptivity, and Optimism) - 专知论文

会员服务 ·

0

优化器 · CASE · 学成 · INFORMS · 在线 ·

2020 年 12 月 21 日

Multi-Agent Online Optimization with Delays: Asynchronicity, Adaptivity, and Optimism

翻译：多边代理在线优化与延迟:非同步性、适应性和乐观主义

Yu-Guan Hsieh,Franck Iutzeler,Jérôme Malick,Panayotis Mertikopoulos

Online learning has been successfully applied to many problems in which data are revealed over time. In this paper, we provide a general framework for studying multi-agent online learning problems in the presence of delays and asynchronicities. Specifically, we propose and analyze a class of adaptive dual averaging schemes in which agents only need to accumulate gradient feedback received from the whole system, without requiring any between-agent coordination. In the single-agent case, the adaptivity of the proposed method allows us to extend a range of existing results to problems with potentially unbounded delays between playing an action and receiving the corresponding feedback. In the multi-agent case, the situation is significantly more complicated because agents may not have access to a global clock to use as a reference point; to overcome this, we focus on the information that is available for producing each prediction rather than the actual delay associated with each feedback. This allows us to derive adaptive learning strategies with optimal regret bounds, at both the agent and network levels. Finally, we also analyze an "optimistic" variant of the proposed algorithm which is capable of exploiting the predictability of problems with a slower variation and leads to improved regret bounds.

翻译：在线学习被成功地应用于长期披露数据的许多问题。在本文中,我们为在出现延误和不同步的情况下研究多试剂在线学习问题提供了一个总体框架。具体地说,我们建议和分析一类适应性双平均计划,其中代理机构只需积累从整个系统收到的梯度反馈,而不需要任何代理机构之间的协调。在单一代理机构的情况下,拟议方法的适应性使我们能够将一系列现有结果扩大到在采取行动和接收相应反馈之间可能出现无限制拖延的问题。在多试剂案例中,情况要复杂得多,因为代理机构可能无法使用全球时钟作为参照点;要克服这一点,我们侧重于可用于进行每项预测的信息,而不是与每项反馈相关的实际延误。这使我们能够在代理机构和网络层面以最适当的遗憾界限来得出适应性学习战略。最后,我们还分析了拟议算法的“乐观性”变式,该算法能够利用问题的可预测性,但变化较慢,并导致改进遗憾界限。

0

相关内容

优化器

Python编程基础，121页ppt

Python编程基础，121页ppt

专知会员服务

49+阅读 · 2021年1月1日

INRIA 最新《机器学习理论》课程笔记，176页pdf

专知会员服务

51+阅读 · 2020年12月14日

最新《非光滑优化》十讲硬核课程，剑桥大学梁经纬博士主讲

最新《非光滑优化》十讲硬核课程，剑桥大学梁经纬博士主讲

专知会员服务

33+阅读 · 2020年8月14日

知识图谱推理，50页ppt，Salesforce首席科学家Richard Socher

知识图谱推理，50页ppt，Salesforce首席科学家Richard Socher

专知会员服务

111+阅读 · 2020年6月10日

【哥伦比亚大学】经济AI优化课程，Economics, AI, and Optimization

【哥伦比亚大学】经济AI优化课程，Economics, AI, and Optimization

专知会员服务

53+阅读 · 2020年2月15日

康奈尔大学Jon Kleinberg经典书《算法设计Algorithm Design》课件PPT与电子书，864页pdf

康奈尔大学Jon Kleinberg经典书《算法设计Algorithm Design》课件PPT与电子书，864页pdf

专知会员服务

235+阅读 · 2020年1月21日

【课程】普林斯顿大学19年春季学期《机器学习优化》课程讲义

【课程】普林斯顿大学19年春季学期《机器学习优化》课程讲义

专知会员服务

85+阅读 · 2019年10月29日

Connections between Support Vector Machines, Wasserstein distance and gradient-penalty GANs

Connections between Support Vector Machines, Wasserstein distance and gradient-penalty GANs

专知会员服务

36+阅读 · 2019年10月17日

强化学习最新教程，17页pdf

强化学习最新教程，17页pdf

专知会员服务

181+阅读 · 2019年10月11日

【新书】Python编程基础，669页pdf

【新书】Python编程基础，669页pdf

专知会员服务

196+阅读 · 2019年10月10日

局部学习的特征选择：Local-Learning-Based Feature Selection

局部学习的特征选择：Local-Learning-Based Feature Selection

我爱读PAMI

14+阅读 · 2019年9月20日

LibRec 精选：AutoML for Contextual Bandits

LibRec 精选：AutoML for Contextual Bandits

LibRec智能推荐

7+阅读 · 2019年9月19日

强化学习三篇论文避免遗忘等

强化学习三篇论文避免遗忘等

CreateAMind

20+阅读 · 2019年5月24日

Hierarchically Structured Meta-learning

Hierarchically Structured Meta-learning

CreateAMind

27+阅读 · 2019年5月22日

动物脑的好奇心和强化学习的好奇心

动物脑的好奇心和强化学习的好奇心

CreateAMind

10+阅读 · 2019年1月26日

meta learning 17年：MAML SNAIL

meta learning 17年：MAML SNAIL

CreateAMind

11+阅读 · 2019年1月2日

RL 真经

CreateAMind

5+阅读 · 2018年12月28日

【论文推荐】最新六篇强化学习相关论文—Sublinear、机器阅读理解、加速强化学习、对抗性奖励学习、人机交互

【论文推荐】最新六篇强化学习相关论文—Sublinear、机器阅读理解、加速强化学习、对抗性奖励学习、人机交互

专知

17+阅读 · 2018年4月28日

【论文】变分推断（Variational inference)的总结

【论文】变分推断（Variational inference)的总结

机器学习研究会

39+阅读 · 2017年11月16日

强化学习族谱

强化学习族谱

CreateAMind

26+阅读 · 2017年8月2日

Zeroth-Order Feedback Optimization for Cooperative Multi-Agent Systems

Arxiv

0+阅读 · 2021年2月23日

Reinforcement Learning of Beam Codebooks in Millimeter Wave and Terahertz MIMO Systems

Arxiv

0+阅读 · 2021年2月22日

Provably Efficient Online Hyperparameter Optimization with Population-Based Bandits

Arxiv

0+阅读 · 2021年2月22日

Dealing with Non-Stationarity in Multi-Agent Reinforcement Learning via Trust Region Decomposition

Arxiv

0+阅读 · 2021年2月21日

Online Competitive Influence Maximization

Arxiv

0+阅读 · 2021年2月20日

Optimal Mixed Discrete-Continuous Planning for Linear Hybrid Systems

Arxiv

0+阅读 · 2021年2月20日

A Variance Controlled Stochastic Method with Biased Estimation for Faster Non-convex Optimization

Arxiv

0+阅读 · 2021年2月19日

Local Convergence of Adaptive Gradient Descent Optimizers

Arxiv

0+阅读 · 2021年2月19日

Online Learning via Offline Greedy Algorithms: Applications in Market Design and Optimization

Arxiv

0+阅读 · 2021年2月18日

Optimal Algorithms for Non-Smooth Distributed Optimization in Networks

Arxiv

7+阅读 · 2018年6月1日

VIP会员

文章信息

相关主题

相关VIP内容

Python编程基础，121页ppt

Python编程基础，121页ppt

专知会员服务

49+阅读 · 2021年1月1日

INRIA 最新《机器学习理论》课程笔记，176页pdf

专知会员服务

51+阅读 · 2020年12月14日

最新《非光滑优化》十讲硬核课程，剑桥大学梁经纬博士主讲

最新《非光滑优化》十讲硬核课程，剑桥大学梁经纬博士主讲

专知会员服务

33+阅读 · 2020年8月14日

知识图谱推理，50页ppt，Salesforce首席科学家Richard Socher

知识图谱推理，50页ppt，Salesforce首席科学家Richard Socher

专知会员服务

111+阅读 · 2020年6月10日

【哥伦比亚大学】经济AI优化课程，Economics, AI, and Optimization

【哥伦比亚大学】经济AI优化课程，Economics, AI, and Optimization

专知会员服务

53+阅读 · 2020年2月15日

康奈尔大学Jon Kleinberg经典书《算法设计Algorithm Design》课件PPT与电子书，864页pdf

康奈尔大学Jon Kleinberg经典书《算法设计Algorithm Design》课件PPT与电子书，864页pdf

专知会员服务

235+阅读 · 2020年1月21日

【课程】普林斯顿大学19年春季学期《机器学习优化》课程讲义

【课程】普林斯顿大学19年春季学期《机器学习优化》课程讲义

专知会员服务

85+阅读 · 2019年10月29日

Connections between Support Vector Machines, Wasserstein distance and gradient-penalty GANs

Connections between Support Vector Machines, Wasserstein distance and gradient-penalty GANs

专知会员服务

36+阅读 · 2019年10月17日

强化学习最新教程，17页pdf

强化学习最新教程，17页pdf

专知会员服务

181+阅读 · 2019年10月11日

【新书】Python编程基础，669页pdf

【新书】Python编程基础，669页pdf

专知会员服务

196+阅读 · 2019年10月10日

热门VIP内容

开通专知VIP会员享更多权益服务

通信行业：智能低空通感网络白皮书

3D形状生成：综述

6000字《伊朗-以色列战争解析：欺骗与信息战如何塑造公众认知》最新报告（附原文）

【博士论文】优化智能体工作流以提升信息获取效率

相关资讯

局部学习的特征选择：Local-Learning-Based Feature Selection

局部学习的特征选择：Local-Learning-Based Feature Selection

我爱读PAMI

14+阅读 · 2019年9月20日

LibRec 精选：AutoML for Contextual Bandits

LibRec 精选：AutoML for Contextual Bandits

LibRec智能推荐

7+阅读 · 2019年9月19日

强化学习三篇论文避免遗忘等

强化学习三篇论文避免遗忘等

CreateAMind

20+阅读 · 2019年5月24日

Hierarchically Structured Meta-learning

Hierarchically Structured Meta-learning

CreateAMind

27+阅读 · 2019年5月22日

动物脑的好奇心和强化学习的好奇心

动物脑的好奇心和强化学习的好奇心

CreateAMind

10+阅读 · 2019年1月26日

meta learning 17年：MAML SNAIL

meta learning 17年：MAML SNAIL

CreateAMind

11+阅读 · 2019年1月2日

RL 真经

CreateAMind

5+阅读 · 2018年12月28日

【论文推荐】最新六篇强化学习相关论文—Sublinear、机器阅读理解、加速强化学习、对抗性奖励学习、人机交互

【论文推荐】最新六篇强化学习相关论文—Sublinear、机器阅读理解、加速强化学习、对抗性奖励学习、人机交互

专知

17+阅读 · 2018年4月28日

【论文】变分推断（Variational inference)的总结

【论文】变分推断（Variational inference)的总结

机器学习研究会

39+阅读 · 2017年11月16日

强化学习族谱

强化学习族谱

CreateAMind

26+阅读 · 2017年8月2日

相关论文

Zeroth-Order Feedback Optimization for Cooperative Multi-Agent Systems

Arxiv

0+阅读 · 2021年2月23日

Reinforcement Learning of Beam Codebooks in Millimeter Wave and Terahertz MIMO Systems

Arxiv

0+阅读 · 2021年2月22日

Provably Efficient Online Hyperparameter Optimization with Population-Based Bandits

Arxiv

0+阅读 · 2021年2月22日

Dealing with Non-Stationarity in Multi-Agent Reinforcement Learning via Trust Region Decomposition

Arxiv

0+阅读 · 2021年2月21日

Online Competitive Influence Maximization

Arxiv

0+阅读 · 2021年2月20日

Optimal Mixed Discrete-Continuous Planning for Linear Hybrid Systems

Arxiv

0+阅读 · 2021年2月20日

A Variance Controlled Stochastic Method with Biased Estimation for Faster Non-convex Optimization

Arxiv

0+阅读 · 2021年2月19日

Local Convergence of Adaptive Gradient Descent Optimizers

Arxiv

0+阅读 · 2021年2月19日

Online Learning via Offline Greedy Algorithms: Applications in Market Design and Optimization

Arxiv

0+阅读 · 2021年2月18日

Optimal Algorithms for Non-Smooth Distributed Optimization in Networks

Arxiv

7+阅读 · 2018年6月1日

微信扫码咨询专知VIP会员