成为VIP会员查看完整内容
VIP会员码认证
首页
主题
发现
会员
服务
注册
·
登录
赌博机/老虎机
关注
0
综合
百科
VIP
热门
动态
论文
精华
Multi-Armed Bandits with Minimum Aggregated Revenue Constraints
Arxiv
0+阅读 · 10月14日
Context-Action Embedding Learning for Off-Policy Evaluation in Contextual Bandits
Arxiv
0+阅读 · 10月14日
Follow-the-Perturbed-Leader for Decoupled Bandits: Best-of-Both-Worlds and Practicality
Arxiv
0+阅读 · 10月14日
Clutch Control: An Attention-based Combinatorial Bandit for Efficient Mutation in JavaScript Engine Fuzzing
Arxiv
0+阅读 · 10月14日
Provable Anytime Ensemble Sampling Algorithms in Nonlinear Contextual Bandits
Arxiv
0+阅读 · 10月12日
Learning with Incomplete Context: Linear Contextual Bandits with Pretrained Imputation
Arxiv
0+阅读 · 10月10日
Online Selective Generation with Adversarial Bandit Feedback
Arxiv
0+阅读 · 10月13日
The Minimal Search Space for Conditional Causal Bandits
Arxiv
0+阅读 · 10月13日
Bandits with Single-Peaked Preferences and Limited Resources
Arxiv
0+阅读 · 10月10日
A Frequency-Domain Analysis of the Multi-Armed Bandit Problem: A New Perspective on the Exploration-Exploitation Trade-off
Arxiv
0+阅读 · 10月10日
Latency-Aware Contextual Bandit: Application to Cryo-EM Data Collection
Arxiv
0+阅读 · 10月9日
Navigating Sparsities in High-Dimensional Linear Contextual Bandits
Arxiv
0+阅读 · 10月9日
Enjoying Non-linearity in Multinomial Logistic Bandits
Arxiv
0+阅读 · 10月8日
Red-Bandit: Test-Time Adaptation for LLM Red-Teaming via Bandit-Guided LoRA Experts
Arxiv
0+阅读 · 10月8日
A Broader View of Thompson Sampling
Arxiv
0+阅读 · 10月8日
参考链接
提示
微信扫码
咨询专知VIP会员与技术项目合作
(加微信请备注: "专知")
微信扫码咨询专知VIP会员
Top