成为VIP会员查看完整内容
VIP会员码认证
首页
主题
发现
会员
服务
注册
·
登录
评价网络
关注
0
综合
百科
VIP
热门
动态
论文
精华
REINFORCE++: An Efficient RLHF Algorithm with Robustness to Both Prompt and Reward Models
Arxiv
0+阅读 · 4月3日
Chunking the Critic: A Transformer-based Soft Actor-Critic with N-Step Returns
Arxiv
0+阅读 · 3月5日
Chunking the Critic: A Transformer-based Soft Actor-Critic with N-Step Returns
Arxiv
0+阅读 · 3月6日
Reliability Modeling for Beyond-5G Mission Critical Networks Using Effective Capacity
Arxiv
0+阅读 · 1月31日
ELENA: Epigenetic Learning through Evolved Neural Adaptation
Arxiv
0+阅读 · 1月10日
Reinforcement Learning with Action Sequence for Data-Efficient Robot Learning
Arxiv
0+阅读 · 2024年11月19日
SmartMME: Implementation of Base Station Switching Off Strategy in ns-3
Arxiv
0+阅读 · 2024年10月26日
Reset & Distill: A Recipe for Overcoming Negative Transfer in Continual Reinforcement Learning
Arxiv
0+阅读 · 2024年8月14日
Explainable AI for Ship Collision Avoidance: Decoding Decision-Making Processes and Behavioral Intentions
Arxiv
0+阅读 · 2024年5月20日
Explainable AI for Ship Collision Avoidance: Decoding Decision-Making Processes and Behavioral Intentions
Arxiv
0+阅读 · 2024年5月15日
Protocols to Code: Formal Verification of a Next-Generation Internet Router
Arxiv
0+阅读 · 2024年5月9日
Reset & Distill: A Recipe for Overcoming Negative Transfer in Continual Reinforcement Learning
Arxiv
0+阅读 · 2024年3月8日
Actor-Critic Model Predictive Control
Arxiv
0+阅读 · 2024年2月28日
Mixed Q-Functionals: Advancing Value-Based Methods in Cooperative MARL with Continuous Action Domains
Arxiv
0+阅读 · 2024年2月12日
Graph Attention-based Reinforcement Learning for Trajectory Design and Resource Assignment in Multi-UAV Assisted Communication
Arxiv
0+阅读 · 2024年1月31日
参考链接
提示
微信扫码
咨询专知VIP会员与技术项目合作
(加微信请备注: "专知")
微信扫码咨询专知VIP会员
Top