多边时代合并的半银行半银行合并战略 (Asymptotically Optimal Strategies For Combinatorial Semi-Bandits in Polynomial Time) - 专知论文

会员服务 ·

0

优化器 · 机器学习 · 计算学习理论 ·

2021 年 2 月 14 日

Asymptotically Optimal Strategies For Combinatorial Semi-Bandits in Polynomial Time

翻译：多边时代合并的半银行半银行合并战略

Thibaut Cuvelier,Richard Combes,Eric Gourdin

from arxiv, 26 pages

We consider combinatorial semi-bandits with uncorrelated Gaussian rewards. In this article, we propose the first method, to the best of our knowledge, that enables to compute the solution of the Graves-Lai optimization problem in polynomial time for many combinatorial structures of interest. In turn, this immediately yields the first known approach to implement asymptotically optimal algorithms in polynomial time for combinatorial semi-bandits.

翻译：我们考虑的是具有与高斯无关联的奖赏的组合半大宗。在本文中,我们建议了第一种方法,根据我们的知识,能够计算多种组合结构感兴趣的多种组合结构在多元时间的格雷夫斯-拉伊优化问题的解决办法。反过来,这立即产生了第一个已知的方法,在复合时间对组合半大宗组合实施非同步最佳算法。

0

相关内容

优化器

【经典书】计算最优传输，209页pdf，Computational Optimal Transport

【经典书】计算最优传输，209页pdf，Computational Optimal Transport

专知会员服务

75+阅读 · 2021年1月10日

【新书】数字图像处理手册第二版，Handbook of Mathematical Methods in Imaging, 2nd edition

【新书】数字图像处理手册第二版，Handbook of Mathematical Methods in Imaging, 2nd edition

专知会员服务

46+阅读 · 2020年2月11日

【CoRL2019最佳论文】模仿学习，A Divergence Minimization Perspective on Imitation Learning Methods

【CoRL2019最佳论文】模仿学习，A Divergence Minimization Perspective on Imitation Learning Methods

专知会员服务

24+阅读 · 2019年11月11日

强化学习最新教程，17页pdf

强化学习最新教程，17页pdf

专知会员服务

182+阅读 · 2019年10月11日

MIT新书《强化学习与最优控制》

MIT新书《强化学习与最优控制》

专知会员服务

282+阅读 · 2019年10月9日

已删除

将门创投

3+阅读 · 2020年8月3日

LibRec 精选：AutoML for Contextual Bandits

LibRec 精选：AutoML for Contextual Bandits

LibRec智能推荐

7+阅读 · 2019年9月19日

On the minimum spanning tree problem in imprecise set-up

Arxiv

0+阅读 · 2021年4月9日

MINVO Basis: Finding Simplexes with Minimum Volume Enclosing Polynomial Curves

Arxiv

0+阅读 · 2021年4月8日

SOLO: Search Online, Learn Offline for Combinatorial Optimization Problems

Arxiv

0+阅读 · 2021年4月8日

Central Moment Analysis for Cost Accumulators in Probabilistic Programs

Arxiv

0+阅读 · 2021年4月8日

Maximal and minimal dynamic Petri net slicing

Arxiv

0+阅读 · 2021年4月7日

VIP会员

文章信息

相关主题

计算学习理论

相关VIP内容

【经典书】计算最优传输，209页pdf，Computational Optimal Transport

【经典书】计算最优传输，209页pdf，Computational Optimal Transport

专知会员服务

75+阅读 · 2021年1月10日

【新书】数字图像处理手册第二版，Handbook of Mathematical Methods in Imaging, 2nd edition

【新书】数字图像处理手册第二版，Handbook of Mathematical Methods in Imaging, 2nd edition

专知会员服务

46+阅读 · 2020年2月11日

【CoRL2019最佳论文】模仿学习，A Divergence Minimization Perspective on Imitation Learning Methods

【CoRL2019最佳论文】模仿学习，A Divergence Minimization Perspective on Imitation Learning Methods

专知会员服务

24+阅读 · 2019年11月11日

强化学习最新教程，17页pdf

强化学习最新教程，17页pdf

专知会员服务

182+阅读 · 2019年10月11日

MIT新书《强化学习与最优控制》

MIT新书《强化学习与最优控制》

专知会员服务

282+阅读 · 2019年10月9日

热门VIP内容

开通专知VIP会员享更多权益服务

【MIT博士论文】弱监督学习：理论、方法与应用

Andrej Karpathy：2025 年 LLM 年度回顾（2025 LLM Year in Review）

锚定情报：合成欺骗时代的地面真相

NeurIPS 2025 | NMKE：基于神经元归因与动态稀疏掩码的终身知识编辑

相关资讯

已删除

将门创投

3+阅读 · 2020年8月3日

LibRec 精选：AutoML for Contextual Bandits

LibRec 精选：AutoML for Contextual Bandits

LibRec智能推荐

7+阅读 · 2019年9月19日

相关论文

On the minimum spanning tree problem in imprecise set-up

Arxiv

0+阅读 · 2021年4月9日

MINVO Basis: Finding Simplexes with Minimum Volume Enclosing Polynomial Curves

Arxiv

0+阅读 · 2021年4月8日

SOLO: Search Online, Learn Offline for Combinatorial Optimization Problems

Arxiv

0+阅读 · 2021年4月8日

Central Moment Analysis for Cost Accumulators in Probabilistic Programs

Arxiv

0+阅读 · 2021年4月8日

Maximal and minimal dynamic Petri net slicing

Arxiv

0+阅读 · 2021年4月7日

微信扫码咨询专知VIP会员