成为VIP会员查看完整内容
VIP会员码认证
首页
主题
发现
会员
服务
注册
·
登录
奖励函数
关注
1
综合
百科
VIP
热门
动态
论文
精华
Efficient Camera Exposure Control for Visual Odometry via Deep Reinforcement Learning
Arxiv
0+阅读 · 12月23日
Efficient Language-instructed Skill Acquisition via Reward-Policy Co-Evolution
Arxiv
0+阅读 · 12月18日
Adaptive Reward Design for Reinforcement Learning in Complex Robotic Tasks
Arxiv
0+阅读 · 12月14日
Empathy Level Alignment via Reinforcement Learning for Empathetic Response Generation
Arxiv
0+阅读 · 12月12日
STARC: A General Framework For Quantifying Differences Between Reward Functions
Arxiv
0+阅读 · 12月12日
Ask1: Development and Reinforcement Learning-Based Control of a Custom Quadruped Robot
Arxiv
0+阅读 · 12月11日
Efficient Diversity-Preserving Diffusion Alignment via Gradient-Informed GFlowNets
Arxiv
0+阅读 · 12月10日
Off-Policy Maximum Entropy RL with Future State and Action Visitation Measures
Arxiv
0+阅读 · 12月9日
Video2Reward: Generating Reward Function from Videos for Legged Robot Behavior Learning
Arxiv
0+阅读 · 12月7日
Robot See, Robot Do: Imitation Reward for Noisy Financial Environments
Arxiv
0+阅读 · 11月13日
Learning Autonomous Docking Operation of Fully Actuated Autonomous Surface Vessel from Expert data
Arxiv
0+阅读 · 11月12日
Health Text Simplification: An Annotated Corpus for Digestive Cancer Education and Novel Strategies for Reinforcement Learning
Arxiv
0+阅读 · 11月10日
CDR: Customizable Density Ratios of Strong-over-weak LLMs for Preference Annotation
Arxiv
0+阅读 · 11月11日
Video-Language Critic: Transferable Reward Functions for Language-Conditioned Robotics
Arxiv
0+阅读 · 11月7日
Aligning Text-to-Image Diffusion Models with Reward Backpropagation
Arxiv
0+阅读 · 11月7日
参考链接
提示
微信扫码
咨询专知VIP会员与技术项目合作
(加微信请备注: "专知")
微信扫码咨询专知VIP会员
Top