秦兵 哈工大社会计算与信息检索研究中心

题目:大语言模型之人类价值观对齐

摘要:目前,以ChatGPT为代表的第四次人工智能技术浪潮席卷社会经济生活的方方面面。该类技术依靠其惊人的能力正在迅速地影响社会的发展。但是,以ChatGPT为代表的大语言模型由于其技术上的原因,其使用仍有可能会对人类和社会造成危害,如生成不准确信息误导人类,输出有害信息伤害人类等。如何将大语言模型的价值观与人类对齐是当前亟待解决的重大问题。本报告将提出从四个层面将大语言模型与人类价值观对齐,其分别是:合事实(讲事实讲逻辑)、合法(符合法律法规)、合情(符合道德情理)以及合文化(符合国家区域文化)。基于此框架,我们详细梳理了现有工作,不仅总结现有任务和方法,更重要的是找到未来有价值的研究方向以及可能的发展趋势。我们坚信人工智能目标是为增进人类福祉和万物和谐共存提供理论支持!因此通过该报告希望能帮助更多的研究者致力于提高大语言模型模型的生成内容的忠实性和价值观对齐,从而让人工智能技术更有益于人类社会。

讲者:秦兵,哈尔滨工业大学计算学部教授,博士生导师,哈尔滨工业大学自然语言处理研究所副所长,社会计算与信息检索研究中心主任。国家重点研发课题、国家自然科学基金重点项目负责人。科技部科技创新2030-“新一代人工智能”重大项目管理专家组专家,中国中文信息学会常务理事/语言与知识计算专委会副主任/情感计算专委会主任,黑龙江省计算机学会自然语言处理专委会主任。主要研究方向:自然语言处理,知识图谱,情感计算,文本生成。获中文信息学会钱伟长中文信息处理科学技术奖一等奖、黑龙江省科学技术奖一等奖、黑龙江省科学技术奖二等奖和黑龙江省技术发明奖二等奖。入选“2020年度人工智能全球女性及AI 2000最具影响力学者榜单”和“福布斯中国2020科技女性榜”。

成为VIP会员查看完整内容
57

相关内容

秦兵,CAAI情感智能专委会副主任哈尔滨工业大学计算学部长聘教授。主要研究方向为自然语言处理、知识图谱构建、情感计算及文本生成等。科技部科技创新2030-“新一代人工智能“重大项目管理专家组成员,中国中文信息学会理事。入选“2020年度人工智能全球女性及AI 2000最具影响力学者榜单”和“福布斯中国2020科技女性榜”。
《小样本元学习》2020最新综述论文
专知会员服务
172+阅读 · 2020年7月31日
【CAAI 2019】自然语言与理解,苏州大学| 周国栋教授
专知会员服务
62+阅读 · 2019年12月1日
论文浅尝 | 知识图谱增强的机器翻译
开放知识图谱
2+阅读 · 2022年9月30日
阿里+北大| 探索工业级GNN的流式训练
图与推荐
0+阅读 · 2022年9月19日
【工大SCIR笔记】多模态信息抽取简述
深度学习自然语言处理
18+阅读 · 2020年4月3日
论文浅尝 | 基于知识库的神经网络问题生成方法
开放知识图谱
19+阅读 · 2019年6月21日
手把手 | 事理图谱,下一代知识图谱
大数据文摘
52+阅读 · 2018年12月29日
清华大学图神经网络综述:模型与应用
机器之心
72+阅读 · 2018年12月26日
展望:模型驱动的深度学习
人工智能学家
12+阅读 · 2018年1月23日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Arxiv
133+阅读 · 2023年4月20日
A Survey of Large Language Models
Arxiv
327+阅读 · 2023年3月31日
Arxiv
56+阅读 · 2023年3月26日
Arxiv
115+阅读 · 2023年3月24日
VIP会员
相关资讯
论文浅尝 | 知识图谱增强的机器翻译
开放知识图谱
2+阅读 · 2022年9月30日
阿里+北大| 探索工业级GNN的流式训练
图与推荐
0+阅读 · 2022年9月19日
【工大SCIR笔记】多模态信息抽取简述
深度学习自然语言处理
18+阅读 · 2020年4月3日
论文浅尝 | 基于知识库的神经网络问题生成方法
开放知识图谱
19+阅读 · 2019年6月21日
手把手 | 事理图谱,下一代知识图谱
大数据文摘
52+阅读 · 2018年12月29日
清华大学图神经网络综述:模型与应用
机器之心
72+阅读 · 2018年12月26日
展望:模型驱动的深度学习
人工智能学家
12+阅读 · 2018年1月23日
相关基金
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
微信扫码咨询专知VIP会员