策略评估论文 - 专知

会员服务 ·

策略评估

Conformal Prediction Beyond the Horizon: Distribution-Free Inference for Policy Evaluation

Arxiv

0+阅读 · 10月29日

Choosing an analytic approach: Key study design considerations in state policy evaluation

Arxiv

0+阅读 · 10月20日

Offline Policy Evaluation of Multi-Turn LLM Health Coaching with Real Users

Arxiv

0+阅读 · 10月21日

Offline Policy Evaluation of Multi-Turn LLM Health Coaching with Real Users

Arxiv

0+阅读 · 10月20日

Reliable and Scalable Robot Policy Evaluation with Imperfect Simulators

Arxiv

0+阅读 · 10月5日

WorldGym: World Model as An Environment for Policy Evaluation

Arxiv

0+阅读 · 9月30日

Finite-Sample Analysis of Policy Evaluation for Robust Average Reward Reinforcement Learning

Arxiv

0+阅读 · 9月28日

A discrete event simulator for policy evaluation in liver allocation in Eurotransplant

Arxiv

0+阅读 · 4月22日

Robot Policy Evaluation for Sim-to-Real Transfer: A Benchmarking Perspective

Arxiv

0+阅读 · 8月14日

A Robust Model-Based Approach for Continuous-Time Policy Evaluation with Unknown Lévy Process Dynamics

Arxiv

0+阅读 · 4月2日

Individualized Policy Evaluation and Learning under Clustered Network Interference

Arxiv

0+阅读 · 4月1日

A Causal Framework for Evaluating Drivers of Policy Effect Heterogeneity Using Difference-in-Differences

Arxiv

0+阅读 · 3月12日

Rule-Guided Reinforcement Learning Policy Evaluation and Improvement

Arxiv

0+阅读 · 3月12日

Clustered KL-barycenter design for policy evaluation

Arxiv

0+阅读 · 3月4日

The surprising efficiency of temporal difference learning for rare event prediction

Arxiv

0+阅读 · 1月16日

参考链接

微信扫码咨询专知VIP会员