VIP内容 - 专知

会员服务 ·

大模型对齐

大模型对齐

【CMU博士论文】面向求真、复杂推理与人类价值的大规模语言模型可扩展对齐

【CMU博士论文】面向求真、复杂推理与人类价值的大规模语言模型可扩展对齐

专知会员服务

16+阅读 · 5月4日

直接偏好优化中的数据集、理论、变体和应用的综合综述

直接偏好优化中的数据集、理论、变体和应用的综合综述

专知会员服务

15+阅读 · 2024年10月24日

大语言模型对齐研究综述

大语言模型对齐研究综述

专知会员服务

56+阅读 · 2024年8月1日

大型语言模型对齐技术综述：RLHF、RLAIF、PPO、DPO 等

大型语言模型对齐技术综述：RLHF、RLAIF、PPO、DPO 等

专知会员服务

55+阅读 · 2024年7月24日

ICML 2024 Spotlight | 在解码中重新对齐，让语言模型更少幻觉、更符合人类偏好

ICML 2024 Spotlight | 在解码中重新对齐，让语言模型更少幻觉、更符合人类偏好

专知会员服务

26+阅读 · 2024年7月3日

【ACL2024】语言模型对齐的不确定性感知学习

【ACL2024】语言模型对齐的不确定性感知学习

专知会员服务

25+阅读 · 2024年6月10日

【ICML2024】多元化对齐路线图

【ICML2024】多元化对齐路线图

专知会员服务

22+阅读 · 2024年5月2日

175页pdf39位作者最新《大型语言模型的对齐与安全的基础挑战》综述

175页pdf39位作者最新《大型语言模型的对齐与安全的基础挑战》综述

专知会员服务

39+阅读 · 2024年4月21日

大模型安全与对齐：复杂系统视角下的AI安全

大模型安全与对齐：复杂系统视角下的AI安全

专知会员服务

47+阅读 · 2024年1月2日

大模型道德价值观对齐问题剖析

大模型道德价值观对齐问题剖析

专知会员服务

79+阅读 · 2023年10月3日

【大模型对齐】利用对齐使大型语言模型更好地推理

【大模型对齐】利用对齐使大型语言模型更好地推理

专知会员服务

48+阅读 · 2023年9月8日

参考链接

微信扫码咨询专知VIP会员