【ACL2024】用于去偏大语言模型的因果引导主动学习，哈工大SCIR荣获国际顶级会议ACL 2024杰出论文奖 - 专知VIP

会员服务 ·

8

ACL 2024 · 大语言模型 · 主动学习 · 因果性 ·

2024 年 8 月 17 日

【ACL2024】用于去偏大语言模型的因果引导主动学习，哈工大SCIR荣获国际顶级会议ACL 2024杰出论文奖

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

ACL会议开始于1963年，在自然语言处理和计算语言学领域中是世界上影响力最大、最具活力的国际学术会议。通过ACL评奖委员会的评审，哈尔滨工业大学社会计算与信息检索研究中心（HIT-SCIR）发表于ACL 2024的论文Causal-Guided Active Learning for Debiasing Large Language Models荣获ACL 2024杰出论文奖，作者有孙洲浩博士生，杜理博士，丁效教授（通讯作者），马翊轩博士生，赵阳博士生，邱凯涛本科生，刘挺教授，秦兵教授。

图1 ACL Outstanding Paper Award 证书

论文介绍

图2 因果指导的主动学习方法

方法动机前人的模型去偏方法要么依赖于人类的先验知识，要么是针对判别式模型设计，当应用于生成式LLM时会损伤LLM的通用性。因此，本文旨在设计一种不损失生成式LLM通用性且不依赖于人类先验知识的模型自动去偏方法。具体地，首先基于因果不变性理论从数据集中自动识别出具有偏见信息的有偏数据（真正决定问题答案的语义信息与答案之间具有因果关系，这种关系在所有数据上都成立；然而偏见信息与问题的答案之间只具有表面的统计意义上的相关关系，这种关系在不同数据上并不一定都成立）；然后利用LLM对这些有偏数据进行归纳从而归纳出可解释的偏见模式比如位置偏见，性别偏见等；最后通过情境学习方法利用之前识别出的有偏数据和归纳出的偏见模式对LLM进行去偏。该工作一方面表明通过利用因果不变性理论，可以有效地识别出有偏数据并从有偏数据中归纳出可解释的偏见模式。另一方面表明通过利用情境学习方法结合识别出的有偏数据和归纳出的偏见模式，可以有效地对LLM进行去偏。与此同时，这篇工作也证明在大模型时代下因果依然十分重要，事理图谱作为一种描述事件间因果关系的图谱依然可以弥补大模型在因果方面的缺陷。数据和代码已开源：https://github.com/spirit-moon-fly/CAL

成为VIP会员查看完整内容

17

相关内容

ACL 2024

上交大ReThinklab实验室ICML2024十篇论文工作简介

上交大ReThinklab实验室ICML2024十篇论文工作简介

专知会员服务

31+阅读 · 2024年5月26日

AAAI2024开会了！Sora为代表的AIGC有何进展？最新《人工智能生成内容(AIGC)进展》教程, 305页ppt

AAAI2024开会了！Sora为代表的AIGC有何进展？最新《人工智能生成内容(AIGC)进展》教程, 305页ppt

专知会员服务

64+阅读 · 2024年2月22日

自然语言处理顶会EMNLP2022奖项公布，康奈尔等学者获最佳长论文奖

自然语言处理顶会EMNLP2022奖项公布，康奈尔等学者获最佳长论文奖

专知会员服务

12+阅读 · 2022年12月12日

信息检索顶会SIGIR2022最佳论文奖出炉，墨尔本理工大学最佳论文，UMass大学等最佳短论文

信息检索顶会SIGIR2022最佳论文奖出炉，墨尔本理工大学最佳论文，UMass大学等最佳短论文

专知会员服务

17+阅读 · 2022年7月15日

多智能体顶级会议AAMAS2022最佳论文

多智能体顶级会议AAMAS2022最佳论文

专知会员服务

62+阅读 · 2022年5月15日

北大首篇《基于图神经网络的推荐系统》综述，211篇参考文献，已被ACM Computing Survey接收

北大首篇《基于图神经网络的推荐系统》综述，211篇参考文献，已被ACM Computing Survey接收

专知会员服务

64+阅读 · 2022年5月8日

清华崔鹏等Nature子刊最新论文：稳定学习建立因果推理和机器学习的共识基础

清华崔鹏等Nature子刊最新论文：稳定学习建立因果推理和机器学习的共识基础

专知会员服务

55+阅读 · 2022年2月27日

信息检索顶会SIGIR2021最佳论文奖出炉，荷兰Radboud大学最佳论文，山东大学最佳学生论文

信息检索顶会SIGIR2021最佳论文奖出炉，荷兰Radboud大学最佳论文，山东大学最佳学生论文

专知会员服务

24+阅读 · 2021年7月14日

AI领域顶会AAMAS2020最佳论文出炉!《深度残差强化学习》牛津大学，Deep Residual RL

AI领域顶会AAMAS2020最佳论文出炉!《深度残差强化学习》牛津大学，Deep Residual RL

专知会员服务

45+阅读 · 2020年5月15日

【CCL 2019】中国计算语言学大会（CCL 2019）技术评测报告以及研讨会

【CCL 2019】中国计算语言学大会（CCL 2019）技术评测报告以及研讨会

专知会员服务

17+阅读 · 2019年11月11日

知识图谱表示学习@ACL2020最新进展概述,9篇必看论文!

知识图谱表示学习@ACL2020最新进展概述,9篇必看论文!

专知

34+阅读 · 2020年7月12日

开启注册丨ACL-IJCAI-SIGIR顶级会议论文报告会（AIS 2020）

开启注册丨ACL-IJCAI-SIGIR顶级会议论文报告会（AIS 2020）

学术头条

13+阅读 · 2020年5月17日

图灵奖Yoshua Bengio ICLR 2020再出新作：通过元学习发掘因果机制

图灵奖Yoshua Bengio ICLR 2020再出新作：通过元学习发掘因果机制

学术头条

15+阅读 · 2019年12月25日

计算所网络数据实验室3篇论文被WSDM2020录用

计算所网络数据实验室3篇论文被WSDM2020录用

中国科学院网络数据重点实验室

26+阅读 · 2019年10月11日

“文本情感语义计算”国家自然科学基金重点项目网站正式上线

“文本情感语义计算”国家自然科学基金重点项目网站正式上线

哈工大SCIR

12+阅读 · 2019年8月16日

【AutoML】自动机器学习：最近进展研究综述 AutoML：A survey of State-of-the-art

【AutoML】自动机器学习：最近进展研究综述 AutoML：A survey of State-of-the-art

产业智能官

15+阅读 · 2019年8月13日

哈工大SCIR三篇论文被ACL 2019录用

哈工大SCIR三篇论文被ACL 2019录用

哈工大SCIR

17+阅读 · 2019年5月15日

CVPR最新医学影像AI论文：利用学习图像变换进行数据增强

CVPR最新医学影像AI论文：利用学习图像变换进行数据增强

AI掘金志

36+阅读 · 2019年3月4日

学界 | 最大化互信息来学习深度表示，Bengio等提出Deep INFOMAX

学界 | 最大化互信息来学习深度表示，Bengio等提出Deep INFOMAX

机器之心

10+阅读 · 2018年9月6日

知识计算组实体对齐工作在ICBK2017学术会议上获得最佳学生论文奖

知识计算组实体对齐工作在ICBK2017学术会议上获得最佳学生论文奖

中国科学院网络数据重点实验室

25+阅读 · 2017年8月22日

城市“建成环境——空间行为”的多尺度影响关系与机理研究

国家自然科学基金

13+阅读 · 2017年12月31日

时滞微分差分系统的最小周期问题--天元数学交流项目

国家自然科学基金

0+阅读 · 2017年12月31日

第七届全国数学文化论坛

国家自然科学基金

3+阅读 · 2016年12月31日

DMB信号水汽探测方法若干问题研究

国家自然科学基金

3+阅读 · 2015年12月31日

高频ZnO/IDT/SiO2/金刚石SAW乳腺癌抗原免疫传感器研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于人类3D视觉感应的2D到3D视频转换关键技术研究

国家自然科学基金

2+阅读 · 2015年12月31日

柔性工序选择的混合流水车间调度及其离散群智能算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

Biot模型基于有限元离散的多重网格算法研究

国家自然科学基金

1+阅读 · 2014年12月31日

海量Web用户生成内容物化关键技术

国家自然科学基金

2+阅读 · 2014年12月31日

基于UGC的应急响应决策支持系统关键技术研究

国家自然科学基金

12+阅读 · 2014年12月31日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

477+阅读 · 2023年3月31日

Vision-Language Pre-training: Basics, Recent Advances, and Future Trends

Arxiv

28+阅读 · 2022年10月17日

Learning with Differentiable Algorithms

Arxiv

11+阅读 · 2022年9月1日

Deep Meta-learning in Recommendation Systems: A Survey

Arxiv

13+阅读 · 2022年6月9日

Graph Structure Learning with Variational Information Bottleneck

Arxiv

11+阅读 · 2021年12月16日

Tensor Decompositions for temporal knowledge base completion

Arxiv

10+阅读 · 2020年4月10日

Causality for Machine Learning

Arxiv

25+阅读 · 2019年11月24日

Multi-view Knowledge Graph Embedding for Entity Alignment

Arxiv

36+阅读 · 2019年6月6日

BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding

Arxiv

15+阅读 · 2018年10月11日

Deep learning in agriculture: A survey

Arxiv

11+阅读 · 2018年7月31日

VIP会员

相关主题

大语言模型

相关VIP内容

上交大ReThinklab实验室ICML2024十篇论文工作简介

上交大ReThinklab实验室ICML2024十篇论文工作简介

专知会员服务

31+阅读 · 2024年5月26日

AAAI2024开会了！Sora为代表的AIGC有何进展？最新《人工智能生成内容(AIGC)进展》教程, 305页ppt

AAAI2024开会了！Sora为代表的AIGC有何进展？最新《人工智能生成内容(AIGC)进展》教程, 305页ppt

专知会员服务

64+阅读 · 2024年2月22日

自然语言处理顶会EMNLP2022奖项公布，康奈尔等学者获最佳长论文奖

自然语言处理顶会EMNLP2022奖项公布，康奈尔等学者获最佳长论文奖

专知会员服务

12+阅读 · 2022年12月12日

信息检索顶会SIGIR2022最佳论文奖出炉，墨尔本理工大学最佳论文，UMass大学等最佳短论文

信息检索顶会SIGIR2022最佳论文奖出炉，墨尔本理工大学最佳论文，UMass大学等最佳短论文

专知会员服务

17+阅读 · 2022年7月15日

多智能体顶级会议AAMAS2022最佳论文

多智能体顶级会议AAMAS2022最佳论文

专知会员服务

62+阅读 · 2022年5月15日

北大首篇《基于图神经网络的推荐系统》综述，211篇参考文献，已被ACM Computing Survey接收

北大首篇《基于图神经网络的推荐系统》综述，211篇参考文献，已被ACM Computing Survey接收

专知会员服务

64+阅读 · 2022年5月8日

清华崔鹏等Nature子刊最新论文：稳定学习建立因果推理和机器学习的共识基础

清华崔鹏等Nature子刊最新论文：稳定学习建立因果推理和机器学习的共识基础

专知会员服务

55+阅读 · 2022年2月27日

信息检索顶会SIGIR2021最佳论文奖出炉，荷兰Radboud大学最佳论文，山东大学最佳学生论文

信息检索顶会SIGIR2021最佳论文奖出炉，荷兰Radboud大学最佳论文，山东大学最佳学生论文

专知会员服务

24+阅读 · 2021年7月14日

AI领域顶会AAMAS2020最佳论文出炉!《深度残差强化学习》牛津大学，Deep Residual RL

AI领域顶会AAMAS2020最佳论文出炉!《深度残差强化学习》牛津大学，Deep Residual RL

专知会员服务

45+阅读 · 2020年5月15日

【CCL 2019】中国计算语言学大会（CCL 2019）技术评测报告以及研讨会

【CCL 2019】中国计算语言学大会（CCL 2019）技术评测报告以及研讨会

专知会员服务

17+阅读 · 2019年11月11日

热门VIP内容

开通专知VIP会员享更多权益服务

《乌克兰无人机产业：志愿者与政策在构建新兴无人机产业中的协同作用》最新报告

《人工智能辅助决策中的数据可视化：系统性综述》

人工智能驱动弹药制造现代化：美国陆军转型之路

《敏捷作战部署中枢纽-辐条基地选址优化研究》80页

相关资讯

知识图谱表示学习@ACL2020最新进展概述,9篇必看论文!

知识图谱表示学习@ACL2020最新进展概述,9篇必看论文!

专知

34+阅读 · 2020年7月12日

开启注册丨ACL-IJCAI-SIGIR顶级会议论文报告会（AIS 2020）

开启注册丨ACL-IJCAI-SIGIR顶级会议论文报告会（AIS 2020）

学术头条

13+阅读 · 2020年5月17日

图灵奖Yoshua Bengio ICLR 2020再出新作：通过元学习发掘因果机制

图灵奖Yoshua Bengio ICLR 2020再出新作：通过元学习发掘因果机制

学术头条

15+阅读 · 2019年12月25日

计算所网络数据实验室3篇论文被WSDM2020录用

计算所网络数据实验室3篇论文被WSDM2020录用

中国科学院网络数据重点实验室

26+阅读 · 2019年10月11日

“文本情感语义计算”国家自然科学基金重点项目网站正式上线

“文本情感语义计算”国家自然科学基金重点项目网站正式上线

哈工大SCIR

12+阅读 · 2019年8月16日

【AutoML】自动机器学习：最近进展研究综述 AutoML：A survey of State-of-the-art

【AutoML】自动机器学习：最近进展研究综述 AutoML：A survey of State-of-the-art

产业智能官

15+阅读 · 2019年8月13日

哈工大SCIR三篇论文被ACL 2019录用

哈工大SCIR三篇论文被ACL 2019录用

哈工大SCIR

17+阅读 · 2019年5月15日

CVPR最新医学影像AI论文：利用学习图像变换进行数据增强

CVPR最新医学影像AI论文：利用学习图像变换进行数据增强

AI掘金志

36+阅读 · 2019年3月4日

学界 | 最大化互信息来学习深度表示，Bengio等提出Deep INFOMAX

学界 | 最大化互信息来学习深度表示，Bengio等提出Deep INFOMAX

机器之心

10+阅读 · 2018年9月6日

知识计算组实体对齐工作在ICBK2017学术会议上获得最佳学生论文奖

知识计算组实体对齐工作在ICBK2017学术会议上获得最佳学生论文奖

中国科学院网络数据重点实验室

25+阅读 · 2017年8月22日

相关基金

城市“建成环境——空间行为”的多尺度影响关系与机理研究

国家自然科学基金

13+阅读 · 2017年12月31日

时滞微分差分系统的最小周期问题--天元数学交流项目

国家自然科学基金

0+阅读 · 2017年12月31日

第七届全国数学文化论坛

国家自然科学基金

3+阅读 · 2016年12月31日

DMB信号水汽探测方法若干问题研究

国家自然科学基金

3+阅读 · 2015年12月31日

高频ZnO/IDT/SiO2/金刚石SAW乳腺癌抗原免疫传感器研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于人类3D视觉感应的2D到3D视频转换关键技术研究

国家自然科学基金

2+阅读 · 2015年12月31日

柔性工序选择的混合流水车间调度及其离散群智能算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

Biot模型基于有限元离散的多重网格算法研究

国家自然科学基金

1+阅读 · 2014年12月31日

海量Web用户生成内容物化关键技术

国家自然科学基金

2+阅读 · 2014年12月31日

基于UGC的应急响应决策支持系统关键技术研究

国家自然科学基金

12+阅读 · 2014年12月31日

相关论文

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

477+阅读 · 2023年3月31日

Vision-Language Pre-training: Basics, Recent Advances, and Future Trends

Arxiv

28+阅读 · 2022年10月17日

Learning with Differentiable Algorithms

Arxiv

11+阅读 · 2022年9月1日

Deep Meta-learning in Recommendation Systems: A Survey

Arxiv

13+阅读 · 2022年6月9日

Graph Structure Learning with Variational Information Bottleneck

Arxiv

11+阅读 · 2021年12月16日

Tensor Decompositions for temporal knowledge base completion

Arxiv

10+阅读 · 2020年4月10日

Causality for Machine Learning

Arxiv

25+阅读 · 2019年11月24日

Multi-view Knowledge Graph Embedding for Entity Alignment

Arxiv

36+阅读 · 2019年6月6日

BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding

Arxiv

15+阅读 · 2018年10月11日

Deep learning in agriculture: A survey

Arxiv

11+阅读 · 2018年7月31日

微信扫码咨询专知VIP会员