标题：应用于序列生成模型的解释性工具箱Inseq 摘要：自然语言处理解释性的过往研究主要关注流行的分类任务，而忽略了生成设置的部分细节，部分原因是缺乏专门的工具。在本文中，我们介绍了Inseq，这是一个Python库，旨在民主化访问序列生成模型的可解释性分析。 Inseq 能够直观和优化地提取流行的仅编码器和编码器-解码器 Transformer 结构中模型的内部信息和特征重要性分数。我们通过采用Inseq来展示其潜力，在机器翻译模型中凸显性别偏见并定位GPT-2中的事实知识。由于其支持对比特征归属等尖端技术的可扩展接口，Inseq可以推动可解释性自然语言生成的未来发展，集中优秀实践，实现公平和可再现的模型评估。 (Inseq: An Interpretability Toolkit for Sequence Generation Models) - 专知论文

会员服务 ·

0

序列生成 · 生成模型 · 可解释性 · 性别偏见 · 语言生成 ·

2023 年 4 月 14 日

Inseq: An Interpretability Toolkit for Sequence Generation Models

翻译：标题：应用于序列生成模型的解释性工具箱Inseq 摘要：自然语言处理解释性的过往研究主要关注流行的分类任务，而忽略了生成设置的部分细节，部分原因是缺乏专门的工具。在本文中，我们介绍了Inseq，这是一个Python库，旨在民主化访问序列生成模型的可解释性分析。 Inseq 能够直观和优化地提取流行的仅编码器和编码器-解码器 Transformer 结构中模型的内部信息和特征重要性分数。我们通过采用Inseq来展示其潜力，在机器翻译模型中凸显性别偏见并定位GPT-2中的事实知识。由于其支持对比特征归属等尖端技术的可扩展接口，Inseq可以推动可解释性自然语言生成的未来发展，集中优秀实践，实现公平和可再现的模型评估。

Gabriele Sarti,Nils Feldhus,Ludwig Sickert,Oskar van der Wal,Malvina Nissim,Arianna Bisazza

from arxiv, Library: https://github.com/inseq-team/inseq, Documentation: https://inseq.readthedocs.io, v0.4

Past work in natural language processing interpretability focused mainly on popular classification tasks while largely overlooking generation settings, partly due to a lack of dedicated tools. In this work, we introduce Inseq, a Python library to democratize access to interpretability analyses of sequence generation models. Inseq enables intuitive and optimized extraction of models' internal information and feature importance scores for popular decoder-only and encoder-decoder Transformers architectures. We showcase its potential by adopting it to highlight gender biases in machine translation models and locate factual knowledge inside GPT-2. Thanks to its extensible interface supporting cutting-edge techniques such as contrastive feature attribution, Inseq can drive future advances in explainable natural language generation, centralizing good practices and enabling fair and reproducible model evaluations.

翻译：

0

相关内容

序列生成

【2022新书】机器学习中的统计建模:概念和应用，398页pdf

【2022新书】机器学习中的统计建模:概念和应用，398页pdf

专知会员服务

142+阅读 · 2022年11月5日

最新《Transformers模型》教程，64页ppt

最新《Transformers模型》教程，64页ppt

专知会员服务

325+阅读 · 2020年11月26日

2020数据工程师成长路线图

专知会员服务

41+阅读 · 2020年9月6日

史上最全！358篇机器学习&自然语言处理综述论文！都这儿了

专知会员服务

129+阅读 · 2020年7月18日

可解释高效异构图卷积网络，Interpretable and Efficient Heterogeneous Graph Convolutional Network

可解释高效异构图卷积网络，Interpretable and Efficient Heterogeneous Graph Convolutional Network

专知会员服务

63+阅读 · 2020年7月12日

【CHI2020-微软】解释可解释性:理解数据科学家使用机器学习的可解释性工具，Interpreting Interpretability: Understanding Data Scientists’Use of Interpretability Tools for Machine Learning

【CHI2020-微软】解释可解释性:理解数据科学家使用机器学习的可解释性工具，Interpreting Interpretability: Understanding Data Scientists’Use of Interpretability Tools for Machine Learning

专知会员服务

55+阅读 · 2020年3月8日

【CHI2020-微软】解释可解释性:理解数据科学家使用机器学习的可解释性工具

【CHI2020-微软】解释可解释性:理解数据科学家使用机器学习的可解释性工具

专知会员服务

103+阅读 · 2020年3月8日

机器学习入门的经验与建议

机器学习入门的经验与建议

专知会员服务

94+阅读 · 2019年10月10日

【CMU卡内基梅隆大学】深度学习在计算机视觉的应用：方法，解释，因果与公平性

【CMU卡内基梅隆大学】深度学习在计算机视觉的应用：方法，解释，因果与公平性

专知会员服务

83+阅读 · 2019年10月9日

【SIGGRAPH2019】TensorFlow 2.0深度学习计算机图形学应用

【SIGGRAPH2019】TensorFlow 2.0深度学习计算机图形学应用

专知会员服务

41+阅读 · 2019年10月9日

图卷积神经网络自然语言处理应用代码和教程

图卷积神经网络自然语言处理应用代码和教程

专知

39+阅读 · 2019年5月21日

收藏 | Tensorflow实现的深度NLP模型集锦（附资源）

收藏 | Tensorflow实现的深度NLP模型集锦（附资源）

THU数据派

12+阅读 · 2019年4月28日

vae 相关论文表示学习 1

vae 相关论文表示学习 1

CreateAMind

12+阅读 · 2018年9月6日

【论文推荐】最新七篇自注意力机制(Self-attention)相关论文—结构化自注意力、相对位置、混合、句子表达、文本向量

【论文推荐】最新七篇自注意力机制(Self-attention)相关论文—结构化自注意力、相对位置、混合、句子表达、文本向量

专知

29+阅读 · 2018年3月12日

【推荐】自然语言处理（NLP）指南

【推荐】自然语言处理（NLP）指南

机器学习研究会

35+阅读 · 2017年11月17日

【推荐】用Python/OpenCV实现增强现实

【推荐】用Python/OpenCV实现增强现实

机器学习研究会

15+阅读 · 2017年11月16日

可解释的CNN

可解释的CNN

CreateAMind

17+阅读 · 2017年10月5日

自然语言处理 (NLP)资源大全

自然语言处理 (NLP)资源大全

机械鸡

35+阅读 · 2017年9月17日

【推荐】用Tensorflow理解LSTM

【推荐】用Tensorflow理解LSTM

机器学习研究会

36+阅读 · 2017年9月11日

【推荐】RNN/LSTM时序预测

【推荐】RNN/LSTM时序预测

机器学习研究会

25+阅读 · 2017年9月8日

中文句子语义概念图自动构建方法及应用研究

国家自然科学基金

3+阅读 · 2014年12月31日

基于组合范畴语法的汉语深层句法分析

国家自然科学基金

0+阅读 · 2013年12月31日

GIS技术支持下工业遗产的价值重现

国家自然科学基金

0+阅读 · 2013年12月31日

西瓜果实糖积累关键基因ClSTP1和ClSTP2的功能解析

国家自然科学基金

0+阅读 · 2012年12月31日

地理信息检索中语境的获取、推理及应用

国家自然科学基金

6+阅读 · 2012年12月31日

基于显著性和信任传递的动态场景主题发现

国家自然科学基金

0+阅读 · 2012年12月31日

乙肝相关性肝癌肝移植术后肿瘤复发的关键突变基因鉴定及功能研究

国家自然科学基金

0+阅读 · 2012年12月31日

实时安全关键系统的建模、仿真与验证

国家自然科学基金

1+阅读 · 2012年12月31日

基于数据驱动的中文自然语言生成关键技术研究

国家自然科学基金

7+阅读 · 2012年12月31日

社会化网络社区中跨域推荐技术研究

国家自然科学基金

0+阅读 · 2011年12月31日

The Hidden Language of Diffusion Models

Arxiv

0+阅读 · 2023年6月1日

Boosting Text-to-Image Diffusion Models with Fine-Grained Semantic Rewards

Arxiv

0+阅读 · 2023年5月31日

Iterative Forward Tuning Boosts In-context Learning in Language Models

Arxiv

0+阅读 · 2023年5月30日

Interpretable and Efficient Heterogeneous Graph Convolutional Network

Arxiv

15+阅读 · 2021年9月8日

An Attentive Survey of Attention Models

An Attentive Survey of Attention Models

Arxiv

44+阅读 · 2020年12月15日

A Survey of the State of Explainable AI for Natural Language Processing

Arxiv

26+阅读 · 2020年10月1日

Fine-grained Event Categorization with Heterogeneous Graph Convolutional Networks

Arxiv

11+阅读 · 2019年6月9日

An Interpretable Reasoning Network for Multi-Relation Question Answering

Arxiv

13+阅读 · 2018年6月1日

Visual Interpretability for Deep Learning: a Survey

Arxiv

16+阅读 · 2018年2月7日

DiSAN: Directional Self-Attention Network for RNN/CNN-Free Language Understanding

Arxiv

16+阅读 · 2017年11月20日

VIP会员

文章信息

相关主题

相关VIP内容

【2022新书】机器学习中的统计建模:概念和应用，398页pdf

【2022新书】机器学习中的统计建模:概念和应用，398页pdf

专知会员服务

142+阅读 · 2022年11月5日

最新《Transformers模型》教程，64页ppt

最新《Transformers模型》教程，64页ppt

专知会员服务

325+阅读 · 2020年11月26日

2020数据工程师成长路线图

专知会员服务

41+阅读 · 2020年9月6日

史上最全！358篇机器学习&自然语言处理综述论文！都这儿了

专知会员服务

129+阅读 · 2020年7月18日

可解释高效异构图卷积网络，Interpretable and Efficient Heterogeneous Graph Convolutional Network

可解释高效异构图卷积网络，Interpretable and Efficient Heterogeneous Graph Convolutional Network

专知会员服务

63+阅读 · 2020年7月12日

【CHI2020-微软】解释可解释性:理解数据科学家使用机器学习的可解释性工具，Interpreting Interpretability: Understanding Data Scientists’Use of Interpretability Tools for Machine Learning

【CHI2020-微软】解释可解释性:理解数据科学家使用机器学习的可解释性工具，Interpreting Interpretability: Understanding Data Scientists’Use of Interpretability Tools for Machine Learning

专知会员服务

55+阅读 · 2020年3月8日

【CHI2020-微软】解释可解释性:理解数据科学家使用机器学习的可解释性工具

【CHI2020-微软】解释可解释性:理解数据科学家使用机器学习的可解释性工具

专知会员服务

103+阅读 · 2020年3月8日

机器学习入门的经验与建议

机器学习入门的经验与建议

专知会员服务

94+阅读 · 2019年10月10日

【CMU卡内基梅隆大学】深度学习在计算机视觉的应用：方法，解释，因果与公平性

【CMU卡内基梅隆大学】深度学习在计算机视觉的应用：方法，解释，因果与公平性

专知会员服务

83+阅读 · 2019年10月9日

【SIGGRAPH2019】TensorFlow 2.0深度学习计算机图形学应用

【SIGGRAPH2019】TensorFlow 2.0深度学习计算机图形学应用

专知会员服务

41+阅读 · 2019年10月9日

热门VIP内容

开通专知VIP会员享更多权益服务

【博士论文】面向开放式世界的鲁棒智能体

美空军如何利用人工智能提升其兵棋推演能力

【AAAI2026】NeSTR：一种用于大型语言模型的神经-符号可溯因框架，用于时间推理

深度强化学习与模仿学习导论

相关资讯

图卷积神经网络自然语言处理应用代码和教程

图卷积神经网络自然语言处理应用代码和教程

专知

39+阅读 · 2019年5月21日

收藏 | Tensorflow实现的深度NLP模型集锦（附资源）

收藏 | Tensorflow实现的深度NLP模型集锦（附资源）

THU数据派

12+阅读 · 2019年4月28日

vae 相关论文表示学习 1

vae 相关论文表示学习 1

CreateAMind

12+阅读 · 2018年9月6日

【论文推荐】最新七篇自注意力机制(Self-attention)相关论文—结构化自注意力、相对位置、混合、句子表达、文本向量

【论文推荐】最新七篇自注意力机制(Self-attention)相关论文—结构化自注意力、相对位置、混合、句子表达、文本向量

专知

29+阅读 · 2018年3月12日

【推荐】自然语言处理（NLP）指南

【推荐】自然语言处理（NLP）指南

机器学习研究会

35+阅读 · 2017年11月17日

【推荐】用Python/OpenCV实现增强现实

【推荐】用Python/OpenCV实现增强现实

机器学习研究会

15+阅读 · 2017年11月16日

可解释的CNN

可解释的CNN

CreateAMind

17+阅读 · 2017年10月5日

自然语言处理 (NLP)资源大全

自然语言处理 (NLP)资源大全

机械鸡

35+阅读 · 2017年9月17日

【推荐】用Tensorflow理解LSTM

【推荐】用Tensorflow理解LSTM

机器学习研究会

36+阅读 · 2017年9月11日

【推荐】RNN/LSTM时序预测

【推荐】RNN/LSTM时序预测

机器学习研究会

25+阅读 · 2017年9月8日

相关论文

The Hidden Language of Diffusion Models

Arxiv

0+阅读 · 2023年6月1日

Boosting Text-to-Image Diffusion Models with Fine-Grained Semantic Rewards

Arxiv

0+阅读 · 2023年5月31日

Iterative Forward Tuning Boosts In-context Learning in Language Models

Arxiv

0+阅读 · 2023年5月30日

Interpretable and Efficient Heterogeneous Graph Convolutional Network

Arxiv

15+阅读 · 2021年9月8日

An Attentive Survey of Attention Models

An Attentive Survey of Attention Models

Arxiv

44+阅读 · 2020年12月15日

A Survey of the State of Explainable AI for Natural Language Processing

Arxiv

26+阅读 · 2020年10月1日

Fine-grained Event Categorization with Heterogeneous Graph Convolutional Networks

Arxiv

11+阅读 · 2019年6月9日

An Interpretable Reasoning Network for Multi-Relation Question Answering

Arxiv

13+阅读 · 2018年6月1日

Visual Interpretability for Deep Learning: a Survey

Arxiv

16+阅读 · 2018年2月7日

DiSAN: Directional Self-Attention Network for RNN/CNN-Free Language Understanding

Arxiv

16+阅读 · 2017年11月20日

相关基金

中文句子语义概念图自动构建方法及应用研究

国家自然科学基金

3+阅读 · 2014年12月31日

基于组合范畴语法的汉语深层句法分析

国家自然科学基金

0+阅读 · 2013年12月31日

GIS技术支持下工业遗产的价值重现

国家自然科学基金

0+阅读 · 2013年12月31日

西瓜果实糖积累关键基因ClSTP1和ClSTP2的功能解析

国家自然科学基金

0+阅读 · 2012年12月31日

地理信息检索中语境的获取、推理及应用

国家自然科学基金

6+阅读 · 2012年12月31日

基于显著性和信任传递的动态场景主题发现

国家自然科学基金

0+阅读 · 2012年12月31日

乙肝相关性肝癌肝移植术后肿瘤复发的关键突变基因鉴定及功能研究

国家自然科学基金

0+阅读 · 2012年12月31日

实时安全关键系统的建模、仿真与验证

国家自然科学基金

1+阅读 · 2012年12月31日

基于数据驱动的中文自然语言生成关键技术研究

国家自然科学基金

7+阅读 · 2012年12月31日

社会化网络社区中跨域推荐技术研究

国家自然科学基金

0+阅读 · 2011年12月31日

微信扫码咨询专知VIP会员