Bandits论文 - 专知

会员服务 ·

Bandits

Adaptive Algorithms for Infinitely Many-Armed Bandits: A Unified Framework

Adaptive Algorithms for Infinitely Many-Armed Bandits: A Unified Framework

Arxiv

0+阅读 · 10月31日

Generalized Linear Bandits: Almost Optimal Regret with One-Pass Update

Arxiv

0+阅读 · 10月30日

Multimodal Bandits: Regret Lower Bounds and Optimal Algorithms

Arxiv

0+阅读 · 10月29日

Scalable Exploration via Ensemble++

Arxiv

0+阅读 · 10月28日

A conversion theorem and minimax optimality for continuum contextual bandits

Arxiv

0+阅读 · 10月27日

Offline Clustering of Linear Bandits: The Power of Clusters under Limited Data

Arxiv

0+阅读 · 10月25日

Diffusion Models Meet Contextual Bandits

Arxiv

0+阅读 · 10月26日

Feel-Good Thompson Sampling for Contextual Bandits: a Markov Chain Monte Carlo Showdown

Arxiv

0+阅读 · 10月24日

Exploration via Feature Perturbation in Contextual Bandits

Arxiv

0+阅读 · 10月24日

Regret Distribution in Stochastic Bandits: Optimal Trade-off between Expectation and Tail Risk

Arxiv

0+阅读 · 10月24日

Scalable LinUCB: Low-Rank Design Matrix Updates for Recommenders with Large Action Spaces

Arxiv

0+阅读 · 10月22日

Non-Stationary Lipschitz Bandits

Arxiv

0+阅读 · 10月22日

Balancing Act: Prioritization Strategies for LLM-Designed Restless Bandit Rewards

Arxiv

0+阅读 · 10月21日

Exploration via Feature Perturbation in Contextual Bandits

Arxiv

0+阅读 · 10月20日

Identifiable Latent Bandits: Leveraging observational data for personalized decision-making

Arxiv

0+阅读 · 10月20日

参考链接

微信扫码咨询专知VIP会员