赌博机/老虎机论文 - 专知

会员服务 ·

赌博机/老虎机

赌博机/老虎机

Generalized Linear Bandits: Almost Optimal Regret with One-Pass Update

Arxiv

0+阅读 · 10月30日

Multimodal Bandits: Regret Lower Bounds and Optimal Algorithms

Arxiv

0+阅读 · 10月29日

Replicable Bandits for Digital Health Interventions

Arxiv

0+阅读 · 10月28日

Optimal Arm Elimination Algorithms for Combinatorial Bandits

Arxiv

0+阅读 · 10月28日

Self-Concordant Perturbations for Linear Bandits

Arxiv

0+阅读 · 10月28日

Diffusion Models Meet Contextual Bandits

Arxiv

0+阅读 · 10月28日

Adapting to Stochastic and Adversarial Losses in Episodic MDPs with Aggregate Bandit Feedback

Arxiv

0+阅读 · 10月27日

A conversion theorem and minimax optimality for continuum contextual bandits

Arxiv

0+阅读 · 10月27日

From Contextual Combinatorial Semi-Bandits to Bandit List Classification: Improved Sample Complexity with Sparse Rewards

Arxiv

0+阅读 · 10月26日

UCB-type Algorithm for Budget-Constrained Expert Learning

Arxiv

0+阅读 · 10月26日

Offline Clustering of Linear Bandits: The Power of Clusters under Limited Data

Arxiv

0+阅读 · 10月25日

Diffusion Models Meet Contextual Bandits

Arxiv

0+阅读 · 10月26日

Oracle-Efficient Combinatorial Semi-Bandits

Arxiv

0+阅读 · 10月24日

Exploration via Feature Perturbation in Contextual Bandits

Arxiv

0+阅读 · 10月24日

Regret Distribution in Stochastic Bandits: Optimal Trade-off between Expectation and Tail Risk

Arxiv

0+阅读 · 10月24日

参考链接

微信扫码咨询专知VIP会员