成为VIP会员查看完整内容
VIP会员码认证
首页
主题
发现
会员
服务
注册
·
登录
策略评估
关注
0
综合
百科
VIP
热门
动态
论文
精华
Evaluating Real-World Robot Manipulation Policies in Simulation
Arxiv
0+阅读 · 5月9日
High-probability sample complexities for policy evaluation with linear function approximation
Arxiv
0+阅读 · 5月2日
Offline Policy Evaluation for Reinforcement Learning with Adaptively Collected Data
Arxiv
0+阅读 · 5月1日
Data Poisoning Attacks on Off-Policy Policy Evaluation Methods
Arxiv
0+阅读 · 4月6日
Transparency challenges in policy evaluation with causal machine learning -- improving usability and accountability
Arxiv
0+阅读 · 3月29日
Offline Reinforcement Learning: Role of State Aggregation and Trajectory Data
Arxiv
0+阅读 · 3月25日
Sample and Communication Efficient Fully Decentralized MARL Policy Evaluation via a New Approach: Local TD update
Arxiv
0+阅读 · 3月23日
Spatially Randomized Designs Can Enhance Policy Evaluation
Arxiv
0+阅读 · 3月18日
SPEED: Experimental Design for Policy Evaluation in Linear Heteroscedastic Bandits
Arxiv
0+阅读 · 3月1日
Externally Valid Policy Evaluation Combining Trial and Observational Data
Arxiv
0+阅读 · 2月22日
Enhancing Reinforcement Learning Agents with Local Guides
Arxiv
0+阅读 · 2月21日
Deep Proxy Causal Learning and its Application to Confounded Bandit Policy Evaluation
Arxiv
0+阅读 · 2月19日
A Distributional Analogue to the Successor Representation
Arxiv
0+阅读 · 2月13日
Individualized Policy Evaluation and Learning under Clustered Network Interference
Arxiv
0+阅读 · 2月4日
$\pi2\text{vec}$: Policy Representations with Successor Features
Arxiv
0+阅读 · 1月24日
参考链接
提示
微信扫码
咨询专知VIP会员与技术项目合作
(加微信请备注: "专知")
微信扫码咨询专知VIP会员
Top