自然语言处理中的探针可解释方法综述 - 专知VIP

会员服务 ·

15

自然语言处理 · 可解释性 ·

自然语言处理中的探针可解释方法综述

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

随着大规模预训练模型的广泛应用，自然语言处理的各领域（如文本分类和机器翻译）均取得了长足的发展.然而，受限于预训练模型的“黑盒”特性，其内部的决策模式以及编码的知识信息被认为是不透明的.以 OpenAI 发布的 ChatGPT 和 GPT-4 为代表的先进预训练模型为例，它们在各领域取得重大性能突破的同时，由于无法获知其内部是否真正编码了人们期望的世界知识或语言属性，以及是否潜藏一些不期望的歧视或偏见现象，因此仍然无法应用于重视安全性和公平性的领域.近年来，一种新颖的可解释性方案“探针任务”有望提升人们对预训练模型各层编码的语言属性的理解.探针任务通过在模型的某一区域训练辅助语言任务，来检验该区域是否编码了感兴趣的语言属性.例如，现有研究通过冻结模型参数并在不同层训练探针任务，已经证明预训练模型在低层编码了更多词性属性而在高层编码了更多语义属性，但由于预训练数据的毒性，很有可能在参数中编码了大量有害内容.本篇综述中，我们首先介绍了探针任务的基本范式，包括任务的定义和基本流程；然后对自然语言处理中现有的探针任务方案进行了系统性的归纳与总结，包括最常用的诊断分类器以及由此衍生出的其他探针方法，为读者提供设计合理探针任务的思路；接着从对比和控制的角度介绍如何解释探针任务的实验结果，以说明探测位置编码感兴趣属性的程度；最后对探针任务的主要应用和未来的关键研究方向进行展望，讨论了当前探针任务亟待解决的问题与挑战.

成为VIP会员查看完整内容

20

相关内容

自然语言处理

自然语言处理

自然语言处理（NLP）是语言学，计算机科学，信息工程和人工智能的一个子领域，与计算机和人类（自然）语言之间的相互作用有关，尤其是如何对计算机进行编程以处理和分析大量自然语言数据。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等

基于Transformer模型的数据模态转换综述

基于Transformer模型的数据模态转换综述

专知会员服务

29+阅读 · 8月17日

大型语言模型在不同自然语言处理任务中的提示工程方法综述

大型语言模型在不同自然语言处理任务中的提示工程方法综述

专知会员服务

48+阅读 · 7月21日

大型语言模型中的人格综述

大型语言模型中的人格综述

专知会员服务

38+阅读 · 6月30日

RAG与RAU：自然语言处理中的检索增强语言模型综述

RAG与RAU：自然语言处理中的检索增强语言模型综述

专知会员服务

63+阅读 · 5月3日

大型语言模型中的数字遗忘：遗忘方法的综述

大型语言模型中的数字遗忘：遗忘方法的综述

专知会员服务

30+阅读 · 4月8日

大型语言模型的高效提示方法综述

大型语言模型的高效提示方法综述

专知会员服务

68+阅读 · 4月2日

可解释人工智能中基于梯度的特征归因技术综述

可解释人工智能中基于梯度的特征归因技术综述

专知会员服务

26+阅读 · 3月20日

大型语言模型在表格推理中的应用综述

大型语言模型在表格推理中的应用综述

专知会员服务

36+阅读 · 2月14日

科学语言建模：大型语言模型在分子科学中的量化综述

科学语言建模：大型语言模型在分子科学中的量化综述

专知会员服务

24+阅读 · 2月8日

大型语言模型幻觉缓解技术的全面综述

大型语言模型幻觉缓解技术的全面综述

专知会员服务

63+阅读 · 1月3日

数据受限条件下的多模态处理技术综述

数据受限条件下的多模态处理技术综述

专知

15+阅读 · 2022年7月16日

【AAAI2021】知识图谱增强的预训练模型的生成式常识推理

【AAAI2021】知识图谱增强的预训练模型的生成式常识推理

专知

26+阅读 · 2021年1月25日

【深度度量学习系列】Triplet-loss原理与应用

【深度度量学习系列】Triplet-loss原理与应用

AINLP

59+阅读 · 2020年10月7日

字节跳动李航提出AMBERT！超越BERT！多粒度token预训练语言模型

字节跳动李航提出AMBERT！超越BERT！多粒度token预训练语言模型

专知

17+阅读 · 2020年8月31日

如何使用自然语言工具包(NLTK)在Python3中执行情感分析

如何使用自然语言工具包(NLTK)在Python3中执行情感分析

Python程序员

19+阅读 · 2019年10月28日

基于PyTorch/TorchText的自然语言处理库

基于PyTorch/TorchText的自然语言处理库

专知

28+阅读 · 2019年4月22日

基于Tacotron模型的语音合成实践

基于Tacotron模型的语音合成实践

深度学习每日摘要

15+阅读 · 2018年12月25日

深度学习与计算机视觉任务应用综述

深度学习与计算机视觉任务应用综述

深度学习与NLP

49+阅读 · 2018年12月18日

一文详解深度学习在命名实体识别(NER)中的应用

一文详解深度学习在命名实体识别(NER)中的应用

AINLP

23+阅读 · 2018年10月23日

论文浅尝 | 当知识图谱遇上零样本学习——零样本学习综述

论文浅尝 | 当知识图谱遇上零样本学习——零样本学习综述

开放知识图谱

20+阅读 · 2018年9月26日

基于图论方法的DNA序列编码研究

国家自然科学基金

2+阅读 · 2016年12月31日

非参数核方法的样本外扩展研究

国家自然科学基金

2+阅读 · 2015年12月31日

布尔可满足性算法和单调布尔函数的复杂性

国家自然科学基金

0+阅读 · 2015年12月31日

整数关系探测的误差可控算法与应用

国家自然科学基金

0+阅读 · 2015年12月31日

模糊认知集群优化的聚类算法

国家自然科学基金

7+阅读 · 2015年12月31日

图像修补中结构矩阵的预处理方法与理论

国家自然科学基金

1+阅读 · 2015年12月31日

面向大规模多步学习问题的学习分类元系统技术研究

国家自然科学基金

4+阅读 · 2015年12月31日

高阶图像去噪模型的快速数值算法研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于结构学习的非平行支持向量机最优化方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

语音识别中的稀疏性深度学习

国家自然科学基金

10+阅读 · 2012年12月31日

A Comprehensive Survey on Deep Graph Representation Learning

Arxiv

83+阅读 · 2023年4月11日

On Efficient Training of Large-Scale Deep Learning Models: A Literature Review

Arxiv

162+阅读 · 2023年4月7日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

372+阅读 · 2023年3月31日

A survey and taxonomy of loss functions in machine learning

Arxiv

22+阅读 · 2023年1月13日

Deep learning: a statistical viewpoint

Arxiv

18+阅读 · 2021年3月16日

Meta-learning in natural and artificial intelligence

Arxiv

10+阅读 · 2020年11月26日

A survey on deep hashing for image retrieval

A survey on deep hashing for image retrieval

Arxiv

14+阅读 · 2020年6月10日

Hyper-SAGNN: a self-attention based graph neural network for hypergraphs

Hyper-SAGNN: a self-attention based graph neural network for hypergraphs

Arxiv

17+阅读 · 2019年11月6日

Augmentation for small object detection

Augmentation for small object detection

Arxiv

11+阅读 · 2019年2月19日

Interpretable machine learning: definitions, methods, and applications

Interpretable machine learning: definitions, methods, and applications

Arxiv

19+阅读 · 2019年1月14日

VIP会员

相关主题

自然语言处理

相关VIP内容

基于Transformer模型的数据模态转换综述

基于Transformer模型的数据模态转换综述

专知会员服务

29+阅读 · 8月17日

大型语言模型在不同自然语言处理任务中的提示工程方法综述

大型语言模型在不同自然语言处理任务中的提示工程方法综述

专知会员服务

48+阅读 · 7月21日

大型语言模型中的人格综述

大型语言模型中的人格综述

专知会员服务

38+阅读 · 6月30日

RAG与RAU：自然语言处理中的检索增强语言模型综述

RAG与RAU：自然语言处理中的检索增强语言模型综述

专知会员服务

63+阅读 · 5月3日

大型语言模型中的数字遗忘：遗忘方法的综述

大型语言模型中的数字遗忘：遗忘方法的综述

专知会员服务

30+阅读 · 4月8日

大型语言模型的高效提示方法综述

大型语言模型的高效提示方法综述

专知会员服务

68+阅读 · 4月2日

可解释人工智能中基于梯度的特征归因技术综述

可解释人工智能中基于梯度的特征归因技术综述

专知会员服务

26+阅读 · 3月20日

大型语言模型在表格推理中的应用综述

大型语言模型在表格推理中的应用综述

专知会员服务

36+阅读 · 2月14日

科学语言建模：大型语言模型在分子科学中的量化综述

科学语言建模：大型语言模型在分子科学中的量化综述

专知会员服务

24+阅读 · 2月8日

大型语言模型幻觉缓解技术的全面综述

大型语言模型幻觉缓解技术的全面综述

专知会员服务

63+阅读 · 1月3日

热门VIP内容

相关资讯

数据受限条件下的多模态处理技术综述

数据受限条件下的多模态处理技术综述

专知

15+阅读 · 2022年7月16日

【AAAI2021】知识图谱增强的预训练模型的生成式常识推理

【AAAI2021】知识图谱增强的预训练模型的生成式常识推理

专知

26+阅读 · 2021年1月25日

【深度度量学习系列】Triplet-loss原理与应用

【深度度量学习系列】Triplet-loss原理与应用

AINLP

59+阅读 · 2020年10月7日

字节跳动李航提出AMBERT！超越BERT！多粒度token预训练语言模型

字节跳动李航提出AMBERT！超越BERT！多粒度token预训练语言模型

专知

17+阅读 · 2020年8月31日

如何使用自然语言工具包(NLTK)在Python3中执行情感分析

如何使用自然语言工具包(NLTK)在Python3中执行情感分析

Python程序员

19+阅读 · 2019年10月28日

基于PyTorch/TorchText的自然语言处理库

基于PyTorch/TorchText的自然语言处理库

专知

28+阅读 · 2019年4月22日

基于Tacotron模型的语音合成实践

基于Tacotron模型的语音合成实践

深度学习每日摘要

15+阅读 · 2018年12月25日

深度学习与计算机视觉任务应用综述

深度学习与计算机视觉任务应用综述

深度学习与NLP

49+阅读 · 2018年12月18日

一文详解深度学习在命名实体识别(NER)中的应用

一文详解深度学习在命名实体识别(NER)中的应用

AINLP

23+阅读 · 2018年10月23日

论文浅尝 | 当知识图谱遇上零样本学习——零样本学习综述

论文浅尝 | 当知识图谱遇上零样本学习——零样本学习综述

开放知识图谱

20+阅读 · 2018年9月26日

相关基金

基于图论方法的DNA序列编码研究

国家自然科学基金

2+阅读 · 2016年12月31日

非参数核方法的样本外扩展研究

国家自然科学基金

2+阅读 · 2015年12月31日

布尔可满足性算法和单调布尔函数的复杂性

国家自然科学基金

0+阅读 · 2015年12月31日

整数关系探测的误差可控算法与应用

国家自然科学基金

0+阅读 · 2015年12月31日

模糊认知集群优化的聚类算法

国家自然科学基金

7+阅读 · 2015年12月31日

图像修补中结构矩阵的预处理方法与理论

国家自然科学基金

1+阅读 · 2015年12月31日

面向大规模多步学习问题的学习分类元系统技术研究

国家自然科学基金

4+阅读 · 2015年12月31日

高阶图像去噪模型的快速数值算法研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于结构学习的非平行支持向量机最优化方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

语音识别中的稀疏性深度学习

国家自然科学基金

10+阅读 · 2012年12月31日

相关论文

A Comprehensive Survey on Deep Graph Representation Learning

Arxiv

83+阅读 · 2023年4月11日

On Efficient Training of Large-Scale Deep Learning Models: A Literature Review

Arxiv

162+阅读 · 2023年4月7日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

372+阅读 · 2023年3月31日

A survey and taxonomy of loss functions in machine learning

Arxiv

22+阅读 · 2023年1月13日

Deep learning: a statistical viewpoint

Arxiv

18+阅读 · 2021年3月16日

Meta-learning in natural and artificial intelligence

Arxiv

10+阅读 · 2020年11月26日

A survey on deep hashing for image retrieval

A survey on deep hashing for image retrieval

Arxiv

14+阅读 · 2020年6月10日

Hyper-SAGNN: a self-attention based graph neural network for hypergraphs

Hyper-SAGNN: a self-attention based graph neural network for hypergraphs

Arxiv

17+阅读 · 2019年11月6日

Augmentation for small object detection

Augmentation for small object detection

Arxiv

11+阅读 · 2019年2月19日

Interpretable machine learning: definitions, methods, and applications

Interpretable machine learning: definitions, methods, and applications

Arxiv

19+阅读 · 2019年1月14日

微信扫码咨询专知VIP会员