We investigate the problem of online learning, which has gained significant attention in recent years due to its applicability in a wide range of fields from machine learning to game theory. Specifically, we study the online optimization of mixable loss functions in a dynamic environment. We introduce online mixture schemes that asymptotically achieves the performance of the best dynamic estimation sequence of the switching oracle with optimal regret redundancies. The best dynamic estimation sequence that we compete against is selected in hindsight with full observation of the loss functions and is allowed to select different optimal estimations in different time intervals (segments). We propose two mixtures in our work. Firstly, we propose a tractable polynomial time complexity algorithm that can achieve the optimal redundancy of the intractable brute force approach. Secondly, we propose an efficient logarithmic time complexity algorithm that can achieve the optimal redundancy up to a constant multiplicity gap. Our results are guaranteed to hold in a strong deterministic sense in an individual sequence manner.


翻译:我们调查了在线学习问题,这个问题近年来由于在从机器学习到游戏理论等广泛领域的应用性而引起极大关注。 具体地说, 我们研究在动态环境中混合损失功能的在线优化。 我们引入了在线混合计划, 以最佳的遗憾冗余方式, 自动实现切换神器最佳动态估计序列的性能。 我们与之竞争的最佳动态估计序列是在事后选择的, 并充分观察损失功能, 并允许在不同的时间间隔( 区块) 中选择不同的最佳估计。 我们建议了两种混合物。 首先, 我们提出了一种可移动的多元时间复杂性算法, 能够实现棘手布鲁特力方法的最佳冗余。 其次, 我们提出了一种高效的对数时间复杂性算法, 能够实现最佳的冗余, 达到一个不变的多重差距。 我们的结果可以保证在单个序列中以强烈的确定性意识保持。

0
下载
关闭预览

相关内容

专知会员服务
40+阅读 · 2021年1月9日
专知会员服务
50+阅读 · 2020年12月14日
专知会员服务
52+阅读 · 2020年9月7日
Fariz Darari简明《博弈论Game Theory》介绍,35页ppt
专知会员服务
106+阅读 · 2020年5月15日
Transferring Knowledge across Learning Processes
CreateAMind
25+阅读 · 2019年5月18日
目标检测之非极大值抑制(NMS)各种变体
极市平台
3+阅读 · 2019年5月2日
已删除
将门创投
3+阅读 · 2019年4月12日
大神 一年100篇论文
CreateAMind
15+阅读 · 2018年12月31日
RL 真经
CreateAMind
5+阅读 · 2018年12月28日
OpenAI丨深度强化学习关键论文列表
中国人工智能学会
17+阅读 · 2018年11月10日
【OpenAI】深度强化学习关键论文列表
专知
11+阅读 · 2018年11月10日
Auto-Encoding GAN
CreateAMind
7+阅读 · 2017年8月4日
Arxiv
0+阅读 · 2021年10月10日
VIP会员
相关资讯
Transferring Knowledge across Learning Processes
CreateAMind
25+阅读 · 2019年5月18日
目标检测之非极大值抑制(NMS)各种变体
极市平台
3+阅读 · 2019年5月2日
已删除
将门创投
3+阅读 · 2019年4月12日
大神 一年100篇论文
CreateAMind
15+阅读 · 2018年12月31日
RL 真经
CreateAMind
5+阅读 · 2018年12月28日
OpenAI丨深度强化学习关键论文列表
中国人工智能学会
17+阅读 · 2018年11月10日
【OpenAI】深度强化学习关键论文列表
专知
11+阅读 · 2018年11月10日
Auto-Encoding GAN
CreateAMind
7+阅读 · 2017年8月4日
Top
微信扫码咨询专知VIP会员