成为VIP会员查看完整内容
VIP会员码认证
首页
主题
发现
会员
服务
注册
·
登录
Bandits
关注
0
综合
百科
VIP
热门
动态
论文
精华
Bi-Criteria Optimization for Combinatorial Bandits: Sublinear Regret and Constraint Violation under Bandit Feedback
Arxiv
0+阅读 · 3月15日
Variance-Dependent Regret Lower Bounds for Contextual Bandits
Arxiv
0+阅读 · 3月15日
A conversion theorem and minimax optimality for continuum contextual bandits
Arxiv
0+阅读 · 3月12日
Contextual Continuum Bandits: Static Versus Dynamic Regret
Arxiv
0+阅读 · 3月3日
A conversion theorem and minimax optimality for continuum contextual bandits
Arxiv
0+阅读 · 3月6日
Converging to Stability in Two-Sided Bandits: The Case of Unknown Preferences on Both Sides of a Matching Market
Arxiv
0+阅读 · 3月11日
Converging to Stability in Two-Sided Bandits: The Case of Unknown Preferences on Both Sides of a Matching Market
Arxiv
0+阅读 · 3月4日
Sparse Additive Contextual Bandits: A Nonparametric Approach for Online Decision-making with High-dimensional Covariates
Arxiv
0+阅读 · 3月21日
Improved Online Confidence Bounds for Multinomial Logistic Bandits
Arxiv
0+阅读 · 3月7日
Greedy Algorithm for Structured Bandits: A Sharp Characterization of Asymptotic Success / Failure
Arxiv
0+阅读 · 3月6日
Risk-sensitive Bandits: Arm Mixture Optimality and Regret-efficient Algorithms
Arxiv
0+阅读 · 3月11日
Near-Optimal Private Learning in Linear Contextual Bandits
Arxiv
0+阅读 · 2月18日
Sequential Change Detection for Learning in Piecewise Stationary Bandit Environments
Arxiv
0+阅读 · 2月7日
Sequential Change Detection for Learning in Piecewise Stationary Bandit Environments
Arxiv
0+阅读 · 1月19日
Multilinguality in LLM-Designed Reward Functions for Restless Bandits: Effects on Task Performance and Fairness
Arxiv
0+阅读 · 1月20日
参考链接
提示
微信扫码
咨询专知VIP会员与技术项目合作
(加微信请备注: "专知")
微信扫码咨询专知VIP会员
Top