秦兵 哈工大社会计算与信息检索研究中心
题目:大语言模型之人类价值观对齐
摘要:目前,以ChatGPT为代表的第四次人工智能技术浪潮席卷社会经济生活的方方面面。该类技术依靠其惊人的能力正在迅速地影响社会的发展。但是,以ChatGPT为代表的大语言模型由于其技术上的原因,其使用仍有可能会对人类和社会造成危害,如生成不准确信息误导人类,输出有害信息伤害人类等。如何将大语言模型的价值观与人类对齐是当前亟待解决的重大问题。本报告将提出从四个层面将大语言模型与人类价值观对齐,其分别是:合事实(讲事实讲逻辑)、合法(符合法律法规)、合情(符合道德情理)以及合文化(符合国家区域文化)。基于此框架,我们详细梳理了现有工作,不仅总结现有任务和方法,更重要的是找到未来有价值的研究方向以及可能的发展趋势。我们坚信人工智能目标是为增进人类福祉和万物和谐共存提供理论支持!因此通过该报告希望能帮助更多的研究者致力于提高大语言模型模型的生成内容的忠实性和价值观对齐,从而让人工智能技术更有益于人类社会。
讲者:秦兵,哈尔滨工业大学计算学部教授,博士生导师,哈尔滨工业大学自然语言处理研究所副所长,社会计算与信息检索研究中心主任。国家重点研发课题、国家自然科学基金重点项目负责人。科技部科技创新2030-“新一代人工智能”重大项目管理专家组专家,中国中文信息学会常务理事/语言与知识计算专委会副主任/情感计算专委会主任,黑龙江省计算机学会自然语言处理专委会主任。主要研究方向:自然语言处理,知识图谱,情感计算,文本生成。获中文信息学会钱伟长中文信息处理科学技术奖一等奖、黑龙江省科学技术奖一等奖、黑龙江省科学技术奖二等奖和黑龙江省技术发明奖二等奖。入选“2020年度人工智能全球女性及AI 2000最具影响力学者榜单”和“福布斯中国2020科技女性榜”。