【AAAI2021】缓解语言模型政治偏见

会员服务 ·

【AAAI2021】缓解语言模型政治偏见

2021 年 2 月 6 日 专知

当前的大规模语言模型可能由于其训练数据而产生政治偏见，当将它们部署在现实环境中时可能会导致严重的问题。

在本文中，我们提出了用于衡量GPT-2生成中的政治偏见的指标，并提出了一种强化学习（RL）框架，用于缓解生成的文本中的政治偏见。通过使用来自词嵌入或分类器的奖励，我们的RL框架无需访问训练数据或要求对模型进行重新训练即可指导去偏见生成。

在对政治偏见敏感的三个属性（性别、位置和主题）的实证实验中，我们的方法根据我们的指标和人工评估很好地减少了偏见，同时保持了可读性和语义一致性。

https://www.cs.dartmouth.edu/~rbliu/aaai_copy.pdf

专知便捷查看

便捷下载，请关注专知公众号（点击上方蓝色专知关注）

后台回复“MPB” 可以获取《【AAAI2021】缓解语言模型政治偏见》专知下载链接索引

专知，专业可信的人工智能知识分发，让认知协作更快更好！欢迎注册登录专知www.zhuanzhi.ai，获取5000+AI主题干货知识资料！

欢迎微信扫一扫加入专知人工智能知识星球群，获取最新AI专业干货知识教程资料和与专家交流咨询！

点击“ 阅读原文 ”，了解使用专知 ，查看获取5000+AI主题知识资源

登录查看更多

相关内容

缓解语言模型

关注 0

持续学习最新综述论文，29页pdf

专知会员服务

120+阅读 · 2021年4月22日

【AAAI2021】以事件为中心的自然语言理解，256页ppt

专知会员服务

74+阅读 · 2021年2月8日

【AAAI2021】非独立同分布下的自分组个性化联邦学习

专知会员服务

27+阅读 · 2021年2月2日

【AAAI2021】长文本的上下文推理

专知会员服务

14+阅读 · 2021年1月18日

【AAAI2021】记忆门控循环网络

专知会员服务

50+阅读 · 2020年12月28日

【AAAI2021】低资源医疗对话生成的图演化元学习

专知会员服务

48+阅读 · 2020年12月26日

【AAAI2021】数据增强图神经网络

专知会员服务

108+阅读 · 2020年12月21日

【AAAI2021】元学习器的冷启动序列推荐

专知会员服务

41+阅读 · 2020年12月19日

【AAAI2021】层次图胶囊网络

专知会员服务

84+阅读 · 2020年12月18日

【AAAI2021】多领域多任务预演的终身学习

专知会员服务

25+阅读 · 2020年12月16日

【WSDM2021-Tutorial】偏见感知推荐系统的进展，134页ppt

专知

10+阅读 · 2021年3月9日

【AAAI2021】近似梯度下降的学习图神经网络

专知

8+阅读 · 2020年12月9日

【快讯】AAAI2021结果出炉，1692篇上榜，你的paper中了吗？

专知

14+阅读 · 2020年12月2日

联邦学习安全与隐私保护研究综述

专知

12+阅读 · 2020年8月7日

CVPR2020最新《小样本学习》综述教程，145页ppt带你学习最新FSL进展

专知

40+阅读 · 2020年6月20日

【清华大学】低资源语言:回顾综述和未来的挑战，14页pdf

专知

9+阅读 · 2020年6月16日

【CVPR2020-北京大学】自适应间隔损失的提升小样本学习

专知

12+阅读 · 2020年6月9日

【SIGIR2020】用于冷启动推荐的内容感知神经哈希

专知

6+阅读 · 2020年6月2日

【伯克利-滴滴出行】深度学习多源领域自适应综述论文

专知

7+阅读 · 2020年2月28日

【CIKM】无偏见排序学习：理论与实践 135页 PPT 教程

专知

4+阅读 · 2018年11月1日

Adversarial and Contrastive Variational Autoencoder for Sequential Recommendation

Arxiv

17+阅读 · 2021年3月19日

Cold-start Sequential Recommendation via Meta Learner

Arxiv

15+阅读 · 2020年12月10日

Memory Augmented Graph Neural Networks for Sequential Recommendation

Arxiv

13+阅读 · 2019年12月26日

Implicit Maximum Likelihood Estimation

Arxiv

7+阅读 · 2018年9月24日

Causal Embeddings for Recommendation

Arxiv

23+阅读 · 2018年8月3日

Diverse Few-Shot Text Classification with Multiple Metrics

Arxiv

6+阅读 · 2018年5月19日

Faithfully Explaining Rankings in a News Recommender System

Arxiv

6+阅读 · 2018年5月14日

Inductive Representation Learning on Large Graphs

Arxiv

3+阅读 · 2018年4月10日

Cross-Paced Representation Learning with Partial Curricula for Sketch-based Image Retrieval

Arxiv

8+阅读 · 2018年3月5日

RankIQA: Learning from Rankings for No-reference Image Quality Assessment

Arxiv

3+阅读 · 2017年7月26日

VIP会员