哈工大秦兵教授 | 大语言模型之人类价值观对齐

秦兵哈工大社会计算与信息检索研究中心

题目：大语言模型之人类价值观对齐

摘要：目前，以ChatGPT为代表的第四次人工智能技术浪潮席卷社会经济生活的方方面面。该类技术依靠其惊人的能力正在迅速地影响社会的发展。但是，以ChatGPT为代表的大语言模型由于其技术上的原因，其使用仍有可能会对人类和社会造成危害，如生成不准确信息误导人类，输出有害信息伤害人类等。如何将大语言模型的价值观与人类对齐是当前亟待解决的重大问题。本报告将提出从四个层面将大语言模型与人类价值观对齐，其分别是：合事实（讲事实讲逻辑）、合法（符合法律法规）、合情（符合道德情理）以及合文化（符合国家区域文化）。基于此框架，我们详细梳理了现有工作，不仅总结现有任务和方法，更重要的是找到未来有价值的研究方向以及可能的发展趋势。我们坚信人工智能目标是为增进人类福祉和万物和谐共存提供理论支持！因此通过该报告希望能帮助更多的研究者致力于提高大语言模型模型的生成内容的忠实性和价值观对齐，从而让人工智能技术更有益于人类社会。

讲者：秦兵，哈尔滨工业大学计算学部教授，博士生导师，哈尔滨工业大学自然语言处理研究所副所长，社会计算与信息检索研究中心主任。国家重点研发课题、国家自然科学基金重点项目负责人。科技部科技创新2030-“新一代人工智能”重大项目管理专家组专家，中国中文信息学会常务理事／语言与知识计算专委会副主任／情感计算专委会主任，黑龙江省计算机学会自然语言处理专委会主任。主要研究方向：自然语言处理，知识图谱，情感计算，文本生成。获中文信息学会钱伟长中文信息处理科学技术奖一等奖、黑龙江省科学技术奖一等奖、黑龙江省科学技术奖二等奖和黑龙江省技术发明奖二等奖。入选“2020年度人工智能全球女性及AI 2000最具影响力学者榜单”和“福布斯中国2020科技女性榜”。

成为VIP会员查看完整内容

相关内容

秦兵

关注 1

秦兵，CAAI情感智能专委会副主任哈尔滨工业大学计算学部长聘教授。主要研究方向为自然语言处理、知识图谱构建、情感计算及文本生成等。科技部科技创新2030-“新一代人工智能“重大项目管理专家组成员，中国中文信息学会理事。入选“2020年度人工智能全球女性及AI 2000最具影响力学者榜单”和“福布斯中国2020科技女性榜”。

机器学习大牛李航细说语言模型的前世今生：从马尔可夫链到GPT

专知会员服务

82+阅读 · 2022年7月24日

爱丁堡大学 | 量化算法交易中的深度强化学习：综述论文

专知会员服务

39+阅读 · 2021年7月7日

《小样本元学习》2020最新综述论文

专知会员服务

173+阅读 · 2020年7月31日

【图机器学习论文】基于深度学习的网络生物学（Deep Learning for Network Biology）

专知会员服务

11+阅读 · 2019年12月16日