精品内容

《直接偏好优化研究综述》
专知会员服务
28+阅读 · 3月18日
多样化偏好优化
专知会员服务
12+阅读 · 2月3日
直接偏好优化中的数据集、理论、变体和应用的综合综述
专知会员服务
15+阅读 · 2024年10月24日
【ACL2024】通过直接偏好优化的自训练提升链式思维推理
直接偏好优化:一种新的RLHF方法,87页ppt
专知会员服务
43+阅读 · 2024年6月10日
【NeurIPS2023】直接偏好优化,代替RLHF
专知会员服务
44+阅读 · 2024年1月7日
参考链接
微信扫码咨询专知VIP会员