成为VIP会员查看完整内容
VIP会员码认证
首页
主题
会员
服务
注册
·
登录
偏好优化
关注
0
综合
百科
VIP
热门
动态
论文
精华
TB or Not TB: Coverage-Driven Direct Preference Optimization for Verilog Stimulus Generation
Arxiv
0+阅读 · 11月19日
DEPO: Dual-Efficiency Preference Optimization for LLM Agents
Arxiv
0+阅读 · 11月19日
Listwise Preference Optimization with Element-wise Confusions for Aspect Sentiment Quad Prediction
Arxiv
0+阅读 · 11月28日
g-DPO: Scalable Preference Optimization for Protein Language Models
Arxiv
0+阅读 · 11月26日
Test-Time Preference Optimization for Image Restoration
Arxiv
0+阅读 · 11月24日
Ambiguity Awareness Optimization: Towards Semantic Disambiguation for Direct Preference Optimization
Arxiv
0+阅读 · 11月28日
Aligning Diffusion Models with Noise-Conditioned Perception
Arxiv
0+阅读 · 12月2日
Atomic Consistency Preference Optimization for Long-Form Question Answering
Arxiv
0+阅读 · 11月10日
On Extending Direct Preference Optimization to Accommodate Ties
Arxiv
0+阅读 · 11月4日
Holistic Utility Preference Learning for Listwise Alignment
Arxiv
0+阅读 · 12月16日
Learning to Align Human Code Preferences
Arxiv
0+阅读 · 12月8日
Reflective Preference Optimization (RPO): Enhancing On-Policy Alignment via Hint-Guided Reflection
Arxiv
0+阅读 · 12月15日
Reg-DPO: SFT-Regularized Direct Preference Optimization with GT-Pair for Improving Video Generation
Arxiv
0+阅读 · 11月5日
MultiSoundGen: Video-to-Audio Generation for Multi-Event Scenarios via SlowFast Contrastive Audio-Visual Pretraining and Direct Preference Optimization
Arxiv
0+阅读 · 11月4日
参考链接
提示
微信扫码
咨询专知VIP会员与技术项目合作
(加微信请备注: "专知")
微信扫码咨询专知VIP会员
Top