We give an $(\varepsilon,\delta)$-differentially private algorithm for the multi-armed bandit (MAB) problem in the shuffle model with a distribution-dependent regret of $O\left(\left(\sum_{a\in [k]:\Delta_a>0}\frac{\log T}{\Delta_a}\right)+\frac{k\sqrt{\log\frac{1}{\delta}}\log T}{\varepsilon}\right)$, and a distribution-independent regret of $O\left(\sqrt{kT\log T}+\frac{k\sqrt{\log\frac{1}{\delta}}\log T}{\varepsilon}\right)$, where $T$ is the number of rounds, $\Delta_a$ is the suboptimality gap of the arm $a$, and $k$ is the total number of arms. Our upper bound almost matches the regret of the best known algorithms for the centralized model, and significantly outperforms the best known algorithm in the local model.


翻译:我们给出了美元( varepsilon,\ delta) 美元, 不同私人的算法, 并给出了在洗牌模型中多武装土匪问题( MAB) 的配发( MAB), 并附有基于分配的遗憾 $Oleft( left) (\\\ sum ⁇ a\ a\ in [ k]:\ Delta_ a> 0\\\\\\ frac\ log T\ k\ t\ k\ t\ log\ frac{ 1\\\\ delta ⁇ log Tunvarepsilon ⁇ right) $, 其中$T是弹数, $\ delta_ a 是手臂的亚最佳差距 $, $( $) 是武器的总数 。 我们的上层几乎匹配了 最著名的中央模型的已知算法的遗憾, 并且大大超越了本地最已知的算法 。

0
下载
关闭预览

相关内容

【干货书】机器学习速查手册,135页pdf
专知会员服务
125+阅读 · 2020年11月20日
Stabilizing Transformers for Reinforcement Learning
专知会员服务
59+阅读 · 2019年10月17日
【综述】多智能体强化学习算法理论研究
深度强化学习实验室
10+阅读 · 2020年9月9日
Normalizing Flows入门(上)
AINLP
8+阅读 · 2020年8月1日
广告算法在阿里文娱用户增长中的实践
DataFunTalk
7+阅读 · 2020年3月11日
Hierarchically Structured Meta-learning
CreateAMind
26+阅读 · 2019年5月22日
Transferring Knowledge across Learning Processes
CreateAMind
28+阅读 · 2019年5月18日
强化学习的Unsupervised Meta-Learning
CreateAMind
17+阅读 · 2019年1月7日
Unsupervised Learning via Meta-Learning
CreateAMind
42+阅读 · 2019年1月3日
meta learning 17年:MAML SNAIL
CreateAMind
11+阅读 · 2019年1月2日
Ray RLlib: Scalable 降龙十八掌
CreateAMind
9+阅读 · 2018年12月28日
【论文】变分推断(Variational inference)的总结
机器学习研究会
39+阅读 · 2017年11月16日
Arxiv
0+阅读 · 2021年12月29日
Arxiv
0+阅读 · 2021年12月29日
Arxiv
0+阅读 · 2021年12月29日
Arxiv
0+阅读 · 2021年12月27日
VIP会员
相关资讯
【综述】多智能体强化学习算法理论研究
深度强化学习实验室
10+阅读 · 2020年9月9日
Normalizing Flows入门(上)
AINLP
8+阅读 · 2020年8月1日
广告算法在阿里文娱用户增长中的实践
DataFunTalk
7+阅读 · 2020年3月11日
Hierarchically Structured Meta-learning
CreateAMind
26+阅读 · 2019年5月22日
Transferring Knowledge across Learning Processes
CreateAMind
28+阅读 · 2019年5月18日
强化学习的Unsupervised Meta-Learning
CreateAMind
17+阅读 · 2019年1月7日
Unsupervised Learning via Meta-Learning
CreateAMind
42+阅读 · 2019年1月3日
meta learning 17年:MAML SNAIL
CreateAMind
11+阅读 · 2019年1月2日
Ray RLlib: Scalable 降龙十八掌
CreateAMind
9+阅读 · 2018年12月28日
【论文】变分推断(Variational inference)的总结
机器学习研究会
39+阅读 · 2017年11月16日
Top
微信扫码咨询专知VIP会员