培训前变形器中的知识中枢 (Knowledge Neurons in Pretrained Transformers) - 专知论文

会员服务 ·

0

神经元 · 变换 · 可辨认的 · 语言模型化 · 查全率/召回率 ·

2021 年 4 月 18 日

Knowledge Neurons in Pretrained Transformers

翻译：培训前变形器中的知识中枢

Damai Dai,Li Dong,Yaru Hao,Zhifang Sui,Furu Wei

Large-scale pretrained language models are surprisingly good at recalling factual knowledge presented in the training corpus. In this paper, we explore how implicit knowledge is stored in pretrained Transformers by introducing the concept of knowledge neurons. Given a relational fact, we propose a knowledge attribution method to identify the neurons that express the fact. We present that the activation of such knowledge neurons is highly correlated to the expression of their corresponding facts. In addition, even without fine-tuning, we can leverage knowledge neurons to explicitly edit (such as update, and erase) specific factual knowledge for pretrained Transformers.

翻译：大规模预先培训的语言模型在回顾培训材料中提供的事实知识方面出人意料地十分出色。在本文中,我们通过引入知识神经元的概念,探索隐含知识如何储存在预先培训的变异器中。基于一个关联性事实,我们提出了一个知识归属方法来识别能表达事实的神经元。我们提出,这种知识神经元的激活与其相应事实的表达密切相关。此外,即使不进行微调,我们也可以利用知识神经元来明确编辑(如更新和删除)预培训变异器的具体事实知识。

0

相关内容

神经元

Knowledge In PLM: 语言模型可以作为一种知识库吗？

专知会员服务

30+阅读 · 2021年6月15日

【Google】平滑对抗训练，Smooth Adversarial Training

【Google】平滑对抗训练，Smooth Adversarial Training

专知会员服务

49+阅读 · 2020年7月4日

KG-BERT：基于BERT的知识图谱补全，KG-BERT: BERT for Knowledge Graph Completion

KG-BERT：基于BERT的知识图谱补全，KG-BERT: BERT for Knowledge Graph Completion

专知会员服务

195+阅读 · 2020年5月31日

超越三元组:基于超关系知识图谱嵌入的链接预测，Beyond Triplets: Hyper-Relational Knowledge Graph Embedding for Link Prediction

专知会员服务

78+阅读 · 2020年5月11日

图卷积神经网络蒸馏知识，Distillating Knowledge from GCN

图卷积神经网络蒸馏知识，Distillating Knowledge from GCN

专知会员服务

96+阅读 · 2020年3月25日

【论文】将符号知识嵌入到深层网络中（Embedding Symbolic Knowledge into Deep Networks）

【论文】将符号知识嵌入到深层网络中（Embedding Symbolic Knowledge into Deep Networks）

专知会员服务

33+阅读 · 2019年12月30日

Auto-Sizing the Transformer Network: Improving Speed, Efficiency, and Performance for Low-Resource Machine Translation

Auto-Sizing the Transformer Network: Improving Speed, Efficiency, and Performance for Low-Resource Machine Translation

专知会员服务

49+阅读 · 2019年10月17日

ExBert — 可视化分析Transformer学到的表示

ExBert — 可视化分析Transformer学到的表示

专知会员服务

32+阅读 · 2019年10月16日

MIT新书《强化学习与最优控制》

MIT新书《强化学习与最优控制》

专知会员服务

280+阅读 · 2019年10月9日

最新BERT相关论文清单，BERT-related Papers

最新BERT相关论文清单，BERT-related Papers

专知会员服务

53+阅读 · 2019年9月29日

pytorch-pretrained-BERT：BERT PyTorch实现，可加载Google BERT预训练模型

pytorch-pretrained-BERT：BERT PyTorch实现，可加载Google BERT预训练模型

AINLP

35+阅读 · 2018年11月6日

已删除

将门创投

4+阅读 · 2018年6月26日

Embedded Knowledge Distillation in Depth-Level Dynamic Neural Network

Embedded Knowledge Distillation in Depth-Level Dynamic Neural Network

Arxiv

0+阅读 · 2021年8月10日

Classification by Attention: Scene Graph Classification with Prior Knowledge

Arxiv

8+阅读 · 2020年11月19日

已删除

Arxiv

32+阅读 · 2020年3月23日

Inducing Relational Knowledge from BERT

Arxiv

3+阅读 · 2019年11月28日

Q-BERT: Hessian Based Ultra Low Precision Quantization of BERT

Arxiv

3+阅读 · 2019年9月12日

KG-BERT: BERT for Knowledge Graph Completion

Arxiv

15+阅读 · 2019年9月11日

Language Models as Knowledge Bases?

Arxiv

6+阅读 · 2019年9月4日

Text Summarization with Pretrained Encoders

Arxiv

5+阅读 · 2019年8月22日

Text Generation from Knowledge Graphs with Graph Transformers

Arxiv

35+阅读 · 2019年4月4日

Interaction Embeddings for Prediction and Explanation in Knowledge Graphs

Arxiv

7+阅读 · 2019年3月12日

VIP会员

文章信息

相关主题

语言模型化

查全率/召回率

相关VIP内容

Knowledge In PLM: 语言模型可以作为一种知识库吗？

专知会员服务

30+阅读 · 2021年6月15日

【Google】平滑对抗训练，Smooth Adversarial Training

【Google】平滑对抗训练，Smooth Adversarial Training

专知会员服务

49+阅读 · 2020年7月4日

KG-BERT：基于BERT的知识图谱补全，KG-BERT: BERT for Knowledge Graph Completion

KG-BERT：基于BERT的知识图谱补全，KG-BERT: BERT for Knowledge Graph Completion

专知会员服务

195+阅读 · 2020年5月31日

超越三元组:基于超关系知识图谱嵌入的链接预测，Beyond Triplets: Hyper-Relational Knowledge Graph Embedding for Link Prediction

专知会员服务

78+阅读 · 2020年5月11日

图卷积神经网络蒸馏知识，Distillating Knowledge from GCN

图卷积神经网络蒸馏知识，Distillating Knowledge from GCN

专知会员服务

96+阅读 · 2020年3月25日

【论文】将符号知识嵌入到深层网络中（Embedding Symbolic Knowledge into Deep Networks）

【论文】将符号知识嵌入到深层网络中（Embedding Symbolic Knowledge into Deep Networks）

专知会员服务

33+阅读 · 2019年12月30日

Auto-Sizing the Transformer Network: Improving Speed, Efficiency, and Performance for Low-Resource Machine Translation

Auto-Sizing the Transformer Network: Improving Speed, Efficiency, and Performance for Low-Resource Machine Translation

专知会员服务

49+阅读 · 2019年10月17日

ExBert — 可视化分析Transformer学到的表示

ExBert — 可视化分析Transformer学到的表示

专知会员服务

32+阅读 · 2019年10月16日

MIT新书《强化学习与最优控制》

MIT新书《强化学习与最优控制》

专知会员服务

280+阅读 · 2019年10月9日

最新BERT相关论文清单，BERT-related Papers

最新BERT相关论文清单，BERT-related Papers

专知会员服务

53+阅读 · 2019年9月29日

热门VIP内容

开通专知VIP会员享更多权益服务

【牛津博士论文】零样本强化学习综述

《美军条令：陆军指挥官与规划人员地理空间指南》60页

战术边缘指挥控制：防务面临的核心挑战

迈向开放世界检测：综述

相关资讯

pytorch-pretrained-BERT：BERT PyTorch实现，可加载Google BERT预训练模型

pytorch-pretrained-BERT：BERT PyTorch实现，可加载Google BERT预训练模型

AINLP

35+阅读 · 2018年11月6日

已删除

将门创投

4+阅读 · 2018年6月26日

相关论文

Embedded Knowledge Distillation in Depth-Level Dynamic Neural Network

Embedded Knowledge Distillation in Depth-Level Dynamic Neural Network

Arxiv

0+阅读 · 2021年8月10日

Classification by Attention: Scene Graph Classification with Prior Knowledge

Arxiv

8+阅读 · 2020年11月19日

已删除

Arxiv

32+阅读 · 2020年3月23日

Inducing Relational Knowledge from BERT

Arxiv

3+阅读 · 2019年11月28日

Q-BERT: Hessian Based Ultra Low Precision Quantization of BERT

Arxiv

3+阅读 · 2019年9月12日

KG-BERT: BERT for Knowledge Graph Completion

Arxiv

15+阅读 · 2019年9月11日

Language Models as Knowledge Bases?

Arxiv

6+阅读 · 2019年9月4日

Text Summarization with Pretrained Encoders

Arxiv

5+阅读 · 2019年8月22日

Text Generation from Knowledge Graphs with Graph Transformers

Arxiv

35+阅读 · 2019年4月4日

Interaction Embeddings for Prediction and Explanation in Knowledge Graphs

Arxiv

7+阅读 · 2019年3月12日

微信扫码咨询专知VIP会员