普通混合损失对切换神器的优化和高效算法 (Optimal and Efficient Algorithms for General Mixable Losses against Switching Oracles) - 专知论文

会员服务 ·

0

优化器 · 估计/估计量 · 损失函数（机器学习） · Oracle · 损失 ·

2021 年 8 月 13 日

Optimal and Efficient Algorithms for General Mixable Losses against Switching Oracles

翻译：普通混合损失对切换神器的优化和高效算法

Kaan Gokcesu,Hakan Gokcesu

We investigate the problem of online learning, which has gained significant attention in recent years due to its applicability in a wide range of fields from machine learning to game theory. Specifically, we study the online optimization of mixable loss functions in a dynamic environment. We introduce online mixture schemes that asymptotically achieves the performance of the best dynamic estimation sequence of the switching oracle with optimal regret redundancies. The best dynamic estimation sequence that we compete against is selected in hindsight with full observation of the loss functions and is allowed to select different optimal estimations in different time intervals (segments). We propose two mixtures in our work. Firstly, we propose a tractable polynomial time complexity algorithm that can achieve the optimal redundancy of the intractable brute force approach. Secondly, we propose an efficient logarithmic time complexity algorithm that can achieve the optimal redundancy up to a constant multiplicity gap. Our results are guaranteed to hold in a strong deterministic sense in an individual sequence manner.

翻译：我们调查了在线学习问题,这个问题近年来由于在从机器学习到游戏理论等广泛领域的应用性而引起极大关注。具体地说, 我们研究在动态环境中混合损失功能的在线优化。我们引入了在线混合计划, 以最佳的遗憾冗余方式, 自动实现切换神器最佳动态估计序列的性能。我们与之竞争的最佳动态估计序列是在事后选择的, 并充分观察损失功能, 并允许在不同的时间间隔( 区块) 中选择不同的最佳估计。我们建议了两种混合物。首先, 我们提出了一种可移动的多元时间复杂性算法, 能够实现棘手布鲁特力方法的最佳冗余。其次, 我们提出了一种高效的对数时间复杂性算法, 能够实现最佳的冗余, 达到一个不变的多重差距。我们的结果可以保证在单个序列中以强烈的确定性意识保持。

0

相关内容

优化器

INRIA最新「机器学习理论」新书，229页pdf原理性阐述机器学习

INRIA最新「机器学习理论」新书，229页pdf原理性阐述机器学习

专知会员服务

69+阅读 · 2021年3月27日

【AAAI2021】图神经网路自监督预训练策略

专知会员服务

41+阅读 · 2021年1月9日

INRIA 最新《机器学习理论》课程笔记，176页pdf

专知会员服务

51+阅读 · 2020年12月14日

不可错过！UIUC最新《统计强化学习》课程！

专知会员服务

53+阅读 · 2020年9月7日

人工智能如何用于抵抗COVID-19？Mila这份《AI against COVID-19 》PPT

专知会员服务

48+阅读 · 2020年5月17日

Fariz Darari简明《博弈论Game Theory》介绍，35页ppt

Fariz Darari简明《博弈论Game Theory》介绍，35页ppt

专知会员服务

111+阅读 · 2020年5月15日

【电子书推荐】机器学习中的高斯过程Gaussian Processes for Machine Learning，剑桥大学 | Carl Edward Rasmussen，爱丁堡大学 | Chris Williams

【电子书推荐】机器学习中的高斯过程Gaussian Processes for Machine Learning，剑桥大学 | Carl Edward Rasmussen，爱丁堡大学 | Chris Williams

专知会员服务

97+阅读 · 2019年11月19日

Auto-Sizing the Transformer Network: Improving Speed, Efficiency, and Performance for Low-Resource Machine Translation

Auto-Sizing the Transformer Network: Improving Speed, Efficiency, and Performance for Low-Resource Machine Translation

专知会员服务

49+阅读 · 2019年10月17日

Connections between Support Vector Machines, Wasserstein distance and gradient-penalty GANs

Connections between Support Vector Machines, Wasserstein distance and gradient-penalty GANs

专知会员服务

36+阅读 · 2019年10月17日

【CMU卡内基梅隆大学】深度学习在计算机视觉的应用：方法，解释，因果与公平性

【CMU卡内基梅隆大学】深度学习在计算机视觉的应用：方法，解释，因果与公平性

专知会员服务

83+阅读 · 2019年10月9日

Transferring Knowledge across Learning Processes

Transferring Knowledge across Learning Processes

CreateAMind

29+阅读 · 2019年5月18日

目标检测之非极大值抑制(NMS)各种变体

目标检测之非极大值抑制(NMS)各种变体

极市平台

3+阅读 · 2019年5月2日

已删除

将门创投

3+阅读 · 2019年4月12日

大神一年100篇论文

大神一年100篇论文

CreateAMind

15+阅读 · 2018年12月31日

RL 真经

CreateAMind

5+阅读 · 2018年12月28日

OpenAI丨深度强化学习关键论文列表

OpenAI丨深度强化学习关键论文列表

中国人工智能学会

17+阅读 · 2018年11月10日

【OpenAI】深度强化学习关键论文列表

【OpenAI】深度强化学习关键论文列表

专知

11+阅读 · 2018年11月10日

【论文推荐】最新十篇度量学习相关论文—可量化表示、非线性度量学习、在线深度量学习、大间隔最近邻、判别深度度量、域自适应

【论文推荐】最新十篇度量学习相关论文—可量化表示、非线性度量学习、在线深度量学习、大间隔最近邻、判别深度度量、域自适应

专知

12+阅读 · 2018年5月18日

【论文推荐】最新六篇强化学习相关论文—Sublinear、机器阅读理解、加速强化学习、对抗性奖励学习、人机交互

【论文推荐】最新六篇强化学习相关论文—Sublinear、机器阅读理解、加速强化学习、对抗性奖励学习、人机交互

专知

17+阅读 · 2018年4月28日

Auto-Encoding GAN

Auto-Encoding GAN

CreateAMind

7+阅读 · 2017年8月4日

Private Federated Learning Without a Trusted Server: Optimal Algorithms for Convex Losses

Arxiv

0+阅读 · 2021年10月12日

Decentralized Cooperative Multi-Agent Reinforcement Learning with Exploration

Arxiv

0+阅读 · 2021年10月12日

Provably Efficient Reinforcement Learning in Decentralized General-Sum Markov Games

Arxiv

0+阅读 · 2021年10月12日

Learning to Coordinate in Multi-Agent Systems: A Coordinated Actor-Critic Algorithm and Finite-Time Guarantees

Arxiv

0+阅读 · 2021年10月11日

Efficient Methods for Online Multiclass Logistic Regression

Arxiv

0+阅读 · 2021年10月10日

Robust Multi-Agent Multi-Armed Bandits

Arxiv

0+阅读 · 2021年10月10日

More Efficient Adversarial Imitation Learning Algorithms With Known and Unknown Transitions

Arxiv

0+阅读 · 2021年10月10日

Statistically and Computationally Efficient Change Point Localization in Regression Settings

Arxiv

0+阅读 · 2021年10月9日

Efficient Local Planning with Linear Function Approximation

Arxiv

0+阅读 · 2021年10月7日

Optimal Algorithms for Non-Smooth Distributed Optimization in Networks

Arxiv

7+阅读 · 2018年6月1日

VIP会员

文章信息

相关主题

估计/估计量

损失函数（机器学习）

相关VIP内容

INRIA最新「机器学习理论」新书，229页pdf原理性阐述机器学习

INRIA最新「机器学习理论」新书，229页pdf原理性阐述机器学习

专知会员服务

69+阅读 · 2021年3月27日

【AAAI2021】图神经网路自监督预训练策略

专知会员服务

41+阅读 · 2021年1月9日

INRIA 最新《机器学习理论》课程笔记，176页pdf

专知会员服务

51+阅读 · 2020年12月14日

不可错过！UIUC最新《统计强化学习》课程！

专知会员服务

53+阅读 · 2020年9月7日

人工智能如何用于抵抗COVID-19？Mila这份《AI against COVID-19 》PPT

专知会员服务

48+阅读 · 2020年5月17日

Fariz Darari简明《博弈论Game Theory》介绍，35页ppt

Fariz Darari简明《博弈论Game Theory》介绍，35页ppt

专知会员服务

111+阅读 · 2020年5月15日

【电子书推荐】机器学习中的高斯过程Gaussian Processes for Machine Learning，剑桥大学 | Carl Edward Rasmussen，爱丁堡大学 | Chris Williams

【电子书推荐】机器学习中的高斯过程Gaussian Processes for Machine Learning，剑桥大学 | Carl Edward Rasmussen，爱丁堡大学 | Chris Williams

专知会员服务

97+阅读 · 2019年11月19日

Auto-Sizing the Transformer Network: Improving Speed, Efficiency, and Performance for Low-Resource Machine Translation

Auto-Sizing the Transformer Network: Improving Speed, Efficiency, and Performance for Low-Resource Machine Translation

专知会员服务

49+阅读 · 2019年10月17日

Connections between Support Vector Machines, Wasserstein distance and gradient-penalty GANs

Connections between Support Vector Machines, Wasserstein distance and gradient-penalty GANs

专知会员服务

36+阅读 · 2019年10月17日

【CMU卡内基梅隆大学】深度学习在计算机视觉的应用：方法，解释，因果与公平性

【CMU卡内基梅隆大学】深度学习在计算机视觉的应用：方法，解释，因果与公平性

专知会员服务

83+阅读 · 2019年10月9日

热门VIP内容

开通专知VIP会员享更多权益服务

《人工智能绝不能完全自主》

《人工智能的法律与伦理：军事自主机器独特挑战的深度剖析》316页

从数据到主导：AI与兵棋推演构筑决策优势

《特洛伊木马货柜：武器化集装箱的战略威胁》最新报告

相关资讯

Transferring Knowledge across Learning Processes

Transferring Knowledge across Learning Processes

CreateAMind

29+阅读 · 2019年5月18日

目标检测之非极大值抑制(NMS)各种变体

目标检测之非极大值抑制(NMS)各种变体

极市平台

3+阅读 · 2019年5月2日

已删除

将门创投

3+阅读 · 2019年4月12日

大神一年100篇论文

大神一年100篇论文

CreateAMind

15+阅读 · 2018年12月31日

RL 真经

CreateAMind

5+阅读 · 2018年12月28日

OpenAI丨深度强化学习关键论文列表

OpenAI丨深度强化学习关键论文列表

中国人工智能学会

17+阅读 · 2018年11月10日

【OpenAI】深度强化学习关键论文列表

【OpenAI】深度强化学习关键论文列表

专知

11+阅读 · 2018年11月10日

【论文推荐】最新十篇度量学习相关论文—可量化表示、非线性度量学习、在线深度量学习、大间隔最近邻、判别深度度量、域自适应

【论文推荐】最新十篇度量学习相关论文—可量化表示、非线性度量学习、在线深度量学习、大间隔最近邻、判别深度度量、域自适应

专知

12+阅读 · 2018年5月18日

【论文推荐】最新六篇强化学习相关论文—Sublinear、机器阅读理解、加速强化学习、对抗性奖励学习、人机交互

【论文推荐】最新六篇强化学习相关论文—Sublinear、机器阅读理解、加速强化学习、对抗性奖励学习、人机交互

专知

17+阅读 · 2018年4月28日

Auto-Encoding GAN

Auto-Encoding GAN

CreateAMind

7+阅读 · 2017年8月4日

相关论文

Private Federated Learning Without a Trusted Server: Optimal Algorithms for Convex Losses

Arxiv

0+阅读 · 2021年10月12日

Decentralized Cooperative Multi-Agent Reinforcement Learning with Exploration

Arxiv

0+阅读 · 2021年10月12日

Provably Efficient Reinforcement Learning in Decentralized General-Sum Markov Games

Arxiv

0+阅读 · 2021年10月12日

Learning to Coordinate in Multi-Agent Systems: A Coordinated Actor-Critic Algorithm and Finite-Time Guarantees

Arxiv

0+阅读 · 2021年10月11日

Efficient Methods for Online Multiclass Logistic Regression

Arxiv

0+阅读 · 2021年10月10日

Robust Multi-Agent Multi-Armed Bandits

Arxiv

0+阅读 · 2021年10月10日

More Efficient Adversarial Imitation Learning Algorithms With Known and Unknown Transitions

Arxiv

0+阅读 · 2021年10月10日

Statistically and Computationally Efficient Change Point Localization in Regression Settings

Arxiv

0+阅读 · 2021年10月9日

Efficient Local Planning with Linear Function Approximation

Arxiv

0+阅读 · 2021年10月7日

Optimal Algorithms for Non-Smooth Distributed Optimization in Networks

Arxiv

7+阅读 · 2018年6月1日

微信扫码咨询专知VIP会员