地方差异私人(传统)强盗学习 (Locally Differentially Private (Contextual) Bandits Learning) - 专知论文

会员服务 ·

0

赌博机/老虎机 · private bandits · 学成 · 上下文赌博机/上下文老虎机 · 黑盒 ·

2020 年 10 月 23 日

Locally Differentially Private (Contextual) Bandits Learning

翻译：地方差异私人(传统)强盗学习

Kai Zheng,Tianle Cai,Weiran Huang,Zhenguo Li,Liwei Wang

from arxiv, Accepted by NeurIPS 2020

We study locally differentially private (LDP) bandits learning in this paper. First, we propose simple black-box reduction frameworks that can solve a large family of context-free bandits learning problems with LDP guarantee. Based on our frameworks, we can improve previous best results for private bandits learning with one-point feedback, such as private Bandits Convex Optimization, and obtain the first result for Bandits Convex Optimization (BCO) with multi-point feedback under LDP. LDP guarantee and black-box nature make our frameworks more attractive in real applications compared with previous specifically designed and relatively weaker differentially private (DP) context-free bandits algorithms. Further, we extend our $(\varepsilon, \delta)$-LDP algorithm to Generalized Linear Bandits, which enjoys a sub-linear regret $\tilde{O}(T^{3/4}/\varepsilon)$ and is conjectured to be nearly optimal. Note that given the existing $\Omega(T)$ lower bound for DP contextual linear bandits (Shariff&Sheffe, 2018), our result shows a fundamental difference between LDP and DP contextual bandits learning.

翻译：在本文中,我们研究了当地差异私人强盗(LDP)的学习。首先,我们建议简单的黑盒减少框架,通过LDP保证解决大型无背景土匪学习问题。根据我们的框架,我们可以通过一点反馈,如私人强盗Convex优化化,改善以前私人强盗学习的最佳结果,并获得第一结果,根据LDP保证和黑盒性质,通过多点反馈,使我们的框架在实际应用中更具吸引力,比以前专门设计且相对较弱的无背景强盗(DP)的无背景强盗算法。此外,我们将我们的美元(valepsilon,\delta)$-LDP算法推广到通用的班迪茨,后者享有亚线性遗憾 $\tilde{O}(T ⁇ 3/4}/\varepslon),并被推测为近乎最佳的。注意到,鉴于现有的美元(Omega)在DP上相对直线性强盗(Sharif & Sheffe,2018)中,我们的基本结果显示在LDP学习上下基的变。

0

相关内容

赌博机/老虎机

赌博机/老虎机

INRIA 最新《机器学习理论》课程笔记，176页pdf

专知会员服务

51+阅读 · 2020年12月14日

【经典书】应用随机微分方程，324页pdf，Applied Stochastic Differential Equations

【经典书】应用随机微分方程，324页pdf，Applied Stochastic Differential Equations

专知会员服务

58+阅读 · 2020年11月21日

哥伦比亚大学最新《机器学习》课程，Fall-B 2020 (Machine Learning)

专知会员服务

39+阅读 · 2020年11月3日

最新《非光滑优化》十讲硬核课程，剑桥大学梁经纬博士主讲

最新《非光滑优化》十讲硬核课程，剑桥大学梁经纬博士主讲

专知会员服务

33+阅读 · 2020年8月14日

【北京大学】Locally Differentially Private (Contextual) Bandits Learning

【北京大学】Locally Differentially Private (Contextual) Bandits Learning

专知会员服务

13+阅读 · 2020年6月8日

可解释强化学习，Explainable Reinforcement Learning: A Survey

可解释强化学习，Explainable Reinforcement Learning: A Survey

专知会员服务

131+阅读 · 2020年5月14日

因果图，Causal Graphs，52页ppt

因果图，Causal Graphs，52页ppt

专知会员服务

250+阅读 · 2020年4月19日

UC.Berkeley CS189讲义教材:《机器学习全面指南》，185页pdf

专知会员服务

162+阅读 · 2020年1月16日

【ICCV 2019 Toturial】Global Optimization for Geometric Understanding with Provable Guarantees（具有可证明保证的几何理解的全局优化）

【ICCV 2019 Toturial】Global Optimization for Geometric Understanding with Provable Guarantees（具有可证明保证的几何理解的全局优化）

专知会员服务

18+阅读 · 2019年11月1日

【CMU卡内基梅隆大学】深度学习在计算机视觉的应用：方法，解释，因果与公平性

【CMU卡内基梅隆大学】深度学习在计算机视觉的应用：方法，解释，因果与公平性

专知会员服务

83+阅读 · 2019年10月9日

LibRec 精选：AutoML for Contextual Bandits

LibRec 精选：AutoML for Contextual Bandits

LibRec智能推荐

7+阅读 · 2019年9月19日

Transferring Knowledge across Learning Processes

Transferring Knowledge across Learning Processes

CreateAMind

29+阅读 · 2019年5月18日

Unsupervised Learning via Meta-Learning

Unsupervised Learning via Meta-Learning

CreateAMind

43+阅读 · 2019年1月3日

meta learning 17年：MAML SNAIL

meta learning 17年：MAML SNAIL

CreateAMind

11+阅读 · 2019年1月2日

RL 真经

CreateAMind

5+阅读 · 2018年12月28日

Hierarchical Imitation - Reinforcement Learning

Hierarchical Imitation - Reinforcement Learning

CreateAMind

19+阅读 · 2018年5月25日

【论文】变分推断（Variational inference)的总结

【论文】变分推断（Variational inference)的总结

机器学习研究会

39+阅读 · 2017年11月16日

【学习】Hierarchical Softmax

【学习】Hierarchical Softmax

机器学习研究会

4+阅读 · 2017年8月6日

强化学习族谱

强化学习族谱

CreateAMind

26+阅读 · 2017年8月2日

LibRec 每周算法：parameter-free contextual bandits (SIGIR'15)

LibRec 每周算法：parameter-free contextual bandits (SIGIR'15)

LibRec智能推荐

5+阅读 · 2017年6月12日

Adaptive Algorithms for Multi-armed Bandit with Composite and Anonymous Feedback

Arxiv

0+阅读 · 2020年12月15日

A One-Size-Fits-All Solution to Conservative Bandit Problems

Arxiv

0+阅读 · 2020年12月15日

Differentially Private Link Prediction With Protected Connections

Arxiv

0+阅读 · 2020年12月14日

Bandit Learning in Decentralized Matching Markets

Arxiv

0+阅读 · 2020年12月14日

Budgeted and Non-budgeted Causal Bandits

Arxiv

0+阅读 · 2020年12月13日

Optimization and Learning With Nonlocal Calculus

Optimization and Learning With Nonlocal Calculus

Arxiv

0+阅读 · 2020年12月13日

Smooth Bandit Optimization: Generalization to Hölder Space

Smooth Bandit Optimization: Generalization to Hölder Space

Arxiv

0+阅读 · 2020年12月11日

Adversarial Linear Contextual Bandits with Graph-Structured Side Observations

Arxiv

0+阅读 · 2020年12月10日

Differentially Private Synthetic Mixed-Type Data Generation For Unsupervised Learning

Differentially Private Synthetic Mixed-Type Data Generation For Unsupervised Learning

Arxiv

0+阅读 · 2020年12月10日

Hierarchical Adaptive Contextual Bandits for Resource Constraint based Recommendation

Arxiv

5+阅读 · 2020年4月2日

VIP会员

文章信息

相关主题

赌博机/老虎机

private bandits

上下文赌博机/上下文老虎机

相关VIP内容

INRIA 最新《机器学习理论》课程笔记，176页pdf

专知会员服务

51+阅读 · 2020年12月14日

【经典书】应用随机微分方程，324页pdf，Applied Stochastic Differential Equations

【经典书】应用随机微分方程，324页pdf，Applied Stochastic Differential Equations

专知会员服务

58+阅读 · 2020年11月21日

哥伦比亚大学最新《机器学习》课程，Fall-B 2020 (Machine Learning)

专知会员服务

39+阅读 · 2020年11月3日

最新《非光滑优化》十讲硬核课程，剑桥大学梁经纬博士主讲

最新《非光滑优化》十讲硬核课程，剑桥大学梁经纬博士主讲

专知会员服务

33+阅读 · 2020年8月14日

【北京大学】Locally Differentially Private (Contextual) Bandits Learning

【北京大学】Locally Differentially Private (Contextual) Bandits Learning

专知会员服务

13+阅读 · 2020年6月8日

可解释强化学习，Explainable Reinforcement Learning: A Survey

可解释强化学习，Explainable Reinforcement Learning: A Survey

专知会员服务

131+阅读 · 2020年5月14日

因果图，Causal Graphs，52页ppt

因果图，Causal Graphs，52页ppt

专知会员服务

250+阅读 · 2020年4月19日

UC.Berkeley CS189讲义教材:《机器学习全面指南》，185页pdf

专知会员服务

162+阅读 · 2020年1月16日

【ICCV 2019 Toturial】Global Optimization for Geometric Understanding with Provable Guarantees（具有可证明保证的几何理解的全局优化）

【ICCV 2019 Toturial】Global Optimization for Geometric Understanding with Provable Guarantees（具有可证明保证的几何理解的全局优化）

专知会员服务

18+阅读 · 2019年11月1日

【CMU卡内基梅隆大学】深度学习在计算机视觉的应用：方法，解释，因果与公平性

【CMU卡内基梅隆大学】深度学习在计算机视觉的应用：方法，解释，因果与公平性

专知会员服务

83+阅读 · 2019年10月9日

热门VIP内容

开通专知VIP会员享更多权益服务

扩散语言模型综述

《美陆军徒步机动作战条令手册》最新168页

【博士论文】理解神经网络的训练动态：从局部优化轨迹与特征学习视角

军事后勤数字化未来展望

相关资讯

LibRec 精选：AutoML for Contextual Bandits

LibRec 精选：AutoML for Contextual Bandits

LibRec智能推荐

7+阅读 · 2019年9月19日

Transferring Knowledge across Learning Processes

Transferring Knowledge across Learning Processes

CreateAMind

29+阅读 · 2019年5月18日

Unsupervised Learning via Meta-Learning

Unsupervised Learning via Meta-Learning

CreateAMind

43+阅读 · 2019年1月3日

meta learning 17年：MAML SNAIL

meta learning 17年：MAML SNAIL

CreateAMind

11+阅读 · 2019年1月2日

RL 真经

CreateAMind

5+阅读 · 2018年12月28日

Hierarchical Imitation - Reinforcement Learning

Hierarchical Imitation - Reinforcement Learning

CreateAMind

19+阅读 · 2018年5月25日

【论文】变分推断（Variational inference)的总结

【论文】变分推断（Variational inference)的总结

机器学习研究会

39+阅读 · 2017年11月16日

【学习】Hierarchical Softmax

【学习】Hierarchical Softmax

机器学习研究会

4+阅读 · 2017年8月6日

强化学习族谱

强化学习族谱

CreateAMind

26+阅读 · 2017年8月2日

LibRec 每周算法：parameter-free contextual bandits (SIGIR'15)

LibRec 每周算法：parameter-free contextual bandits (SIGIR'15)

LibRec智能推荐

5+阅读 · 2017年6月12日

相关论文

Adaptive Algorithms for Multi-armed Bandit with Composite and Anonymous Feedback

Arxiv

0+阅读 · 2020年12月15日

A One-Size-Fits-All Solution to Conservative Bandit Problems

Arxiv

0+阅读 · 2020年12月15日

Differentially Private Link Prediction With Protected Connections

Arxiv

0+阅读 · 2020年12月14日

Bandit Learning in Decentralized Matching Markets

Arxiv

0+阅读 · 2020年12月14日

Budgeted and Non-budgeted Causal Bandits

Arxiv

0+阅读 · 2020年12月13日

Optimization and Learning With Nonlocal Calculus

Optimization and Learning With Nonlocal Calculus

Arxiv

0+阅读 · 2020年12月13日

Smooth Bandit Optimization: Generalization to Hölder Space

Smooth Bandit Optimization: Generalization to Hölder Space

Arxiv

0+阅读 · 2020年12月11日

Adversarial Linear Contextual Bandits with Graph-Structured Side Observations

Arxiv

0+阅读 · 2020年12月10日

Differentially Private Synthetic Mixed-Type Data Generation For Unsupervised Learning

Differentially Private Synthetic Mixed-Type Data Generation For Unsupervised Learning

Arxiv

0+阅读 · 2020年12月10日

Hierarchical Adaptive Contextual Bandits for Resource Constraint based Recommendation

Arxiv

5+阅读 · 2020年4月2日

微信扫码咨询专知VIP会员