直接偏好优化中的数据集、理论、变体和应用的综合综述
专知会员服务
13+阅读 · 2024年10月24日
大语言模型对齐研究综述
专知会员服务
51+阅读 · 2024年8月1日
大型语言模型对齐技术综述:RLHF、RLAIF、PPO、DPO 等
专知会员服务
53+阅读 · 2024年7月24日
【ACL2024】语言模型对齐的不确定性感知学习
专知会员服务
23+阅读 · 2024年6月10日
【ICML2024】多元化对齐路线图
专知会员服务
20+阅读 · 2024年5月2日
大模型安全与对齐:复杂系统视角下的AI安全
专知会员服务
41+阅读 · 2024年1月2日
大模型道德价值观对齐问题剖析
专知会员服务
78+阅读 · 2023年10月3日
【大模型对齐】利用对齐使大型语言模型更好地推理
专知会员服务
45+阅读 · 2023年9月8日
参考链接
微信扫码咨询专知VIP会员