随着大规模预训练模型的广泛应用,自然语言处理的各领域(如文本分类和机器翻译)均取得了长足的发展.然 而,受限于预训练模型的“黑盒”特性,其内部的决策模式以及编码的知识信息被认为是不透明的.以 OpenAI 发布的 ChatGPT 和 GPT-4 为代表的先进预训练模型为例,它们在各领域取得重大性能突破的同时,由于无法获知其内部是否真正 编码了人们期望的世界知识或语言属性,以及是否潜藏一些不期望的歧视或偏见现象,因此仍然无法应用于重视安全性和 公平性的领域.近年来,一种新颖的可解释性方案“探针任务”有望提升人们对预训练模型各层编码的语言属性的理解.探针 任务通过在模型的某一区域训练辅助语言任务,来检验该区域是否编码了感兴趣的语言属性.例如,现有研究通过冻结模型 参数并在不同层训练探针任务,已经证明预训练模型在低层编码了更多词性属性而在高层编码了更多语义属性,但由于预 训练数据的毒性,很有可能在参数中编码了大量有害内容.本篇综述中,我们首先介绍了探针任务的基本范式,包括任务的 定义和基本流程;然后对自然语言处理中现有的探针任务方案进行了系统性的归纳与总结,包括最常用的诊断分类器以及 由此衍生出的其他探针方法,为读者提供设计合理探针任务的思路;接着从对比和控制的角度介绍如何解释探针任务的实 验结果,以说明探测位置编码感兴趣属性的程度;最后对探针任务的主要应用和未来的关键研究方向进行展望,讨论了当 前探针任务亟待解决的问题与挑战.

成为VIP会员查看完整内容
22

相关内容

自然语言处理(NLP)是语言学,计算机科学,信息工程和人工智能的一个子领域,与计算机和人类(自然)语言之间的相互作用有关,尤其是如何对计算机进行编程以处理和分析大量自然语言数据 。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等
基于Transformer模型的数据模态转换综述
专知会员服务
33+阅读 · 8月17日
大型语言模型中的人格综述
专知会员服务
40+阅读 · 6月30日
大型语言模型中的数字遗忘:遗忘方法的综述
专知会员服务
31+阅读 · 4月8日
大型语言模型的高效提示方法综述
专知会员服务
68+阅读 · 4月2日
可解释人工智能中基于梯度的特征归因技术综述
专知会员服务
26+阅读 · 3月20日
大型语言模型在表格推理中的应用综述
专知会员服务
37+阅读 · 2月14日
大型语言模型幻觉缓解技术的全面综述
专知会员服务
65+阅读 · 1月3日
数据受限条件下的多模态处理技术综述
专知
16+阅读 · 2022年7月16日
如何使用自然语言工具包(NLTK)在Python3中执行情感分析
Python程序员
19+阅读 · 2019年10月28日
基于PyTorch/TorchText的自然语言处理库
专知
28+阅读 · 2019年4月22日
基于Tacotron模型的语音合成实践
深度学习每日摘要
15+阅读 · 2018年12月25日
深度学习与计算机视觉任务应用综述
深度学习与NLP
50+阅读 · 2018年12月18日
国家自然科学基金
2+阅读 · 2016年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
7+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
10+阅读 · 2012年12月31日
A Survey of Large Language Models
Arxiv
397+阅读 · 2023年3月31日
Arxiv
18+阅读 · 2021年3月16日
Arxiv
10+阅读 · 2020年11月26日
A survey on deep hashing for image retrieval
Arxiv
14+阅读 · 2020年6月10日
Augmentation for small object detection
Arxiv
11+阅读 · 2019年2月19日
VIP会员
相关VIP内容
基于Transformer模型的数据模态转换综述
专知会员服务
33+阅读 · 8月17日
大型语言模型中的人格综述
专知会员服务
40+阅读 · 6月30日
大型语言模型中的数字遗忘:遗忘方法的综述
专知会员服务
31+阅读 · 4月8日
大型语言模型的高效提示方法综述
专知会员服务
68+阅读 · 4月2日
可解释人工智能中基于梯度的特征归因技术综述
专知会员服务
26+阅读 · 3月20日
大型语言模型在表格推理中的应用综述
专知会员服务
37+阅读 · 2月14日
大型语言模型幻觉缓解技术的全面综述
专知会员服务
65+阅读 · 1月3日
相关资讯
数据受限条件下的多模态处理技术综述
专知
16+阅读 · 2022年7月16日
如何使用自然语言工具包(NLTK)在Python3中执行情感分析
Python程序员
19+阅读 · 2019年10月28日
基于PyTorch/TorchText的自然语言处理库
专知
28+阅读 · 2019年4月22日
基于Tacotron模型的语音合成实践
深度学习每日摘要
15+阅读 · 2018年12月25日
深度学习与计算机视觉任务应用综述
深度学习与NLP
50+阅读 · 2018年12月18日
相关基金
国家自然科学基金
2+阅读 · 2016年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
7+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
10+阅读 · 2012年12月31日
相关论文
A Survey of Large Language Models
Arxiv
397+阅读 · 2023年3月31日
Arxiv
18+阅读 · 2021年3月16日
Arxiv
10+阅读 · 2020年11月26日
A survey on deep hashing for image retrieval
Arxiv
14+阅读 · 2020年6月10日
Augmentation for small object detection
Arxiv
11+阅读 · 2019年2月19日
微信扫码咨询专知VIP会员