成为VIP会员查看完整内容
VIP会员码认证
首页
主题
发现
会员
服务
注册
·
登录
赌博机/老虎机
关注
0
综合
百科
VIP
热门
动态
论文
精华
Online Policy Learning and Inference by Matrix Completion
Arxiv
0+阅读 · 12月19日
Speed Up the Cold-Start Learning in Two-Sided Bandits with Many Arms
Arxiv
0+阅读 · 12月18日
The Bandit Whisperer: Communication Learning for Restless Bandits
Arxiv
0+阅读 · 12月17日
p-Mean Regret for Stochastic Bandits
Arxiv
0+阅读 · 12月14日
Stochastic $k$-Submodular Bandits with Full Bandit Feedback
Arxiv
0+阅读 · 12月14日
Optimal Multitask Linear Regression and Contextual Bandits under Sparse Heterogeneity
Arxiv
0+阅读 · 12月13日
On the Precise Asymptotics and Refined Regret of the Variance-Aware UCB Algorithm
Arxiv
0+阅读 · 12月12日
Nearly Minimax Optimal Submodular Maximization with Bandit Feedback
Arxiv
0+阅读 · 12月12日
IRL for Restless Multi-Armed Bandits with Applications in Maternal and Child Health
Arxiv
0+阅读 · 12月11日
Adapting to Non-Stationary Environments: Multi-Armed Bandit Enhanced Retrieval-Augmented Generation on Knowledge Graphs
Arxiv
0+阅读 · 12月10日
Assouad, Fano, and Le Cam with Interaction: A Unifying Lower Bound Framework and Characterization for Bandit Learnability
Arxiv
0+阅读 · 12月6日
Solving a global optimal problem requires only two-armed slot machine
Arxiv
0+阅读 · 12月7日
Crowdsourced Adaptive Surveys
Arxiv
0+阅读 · 12月6日
The Vizier Gaussian Process Bandit Algorithm
Arxiv
0+阅读 · 12月6日
Combinatorial Selection with Costly Information
Arxiv
0+阅读 · 12月5日
参考链接
提示
微信扫码
咨询专知VIP会员与技术项目合作
(加微信请备注: "专知")
微信扫码咨询专知VIP会员
Top