谷歌开源NLP模型可视化工具LIT，模型训练不再「黑箱」

会员服务 ·

谷歌开源NLP模型可视化工具LIT，模型训练不再「黑箱」

2020 年 8 月 26 日 机器之心

机器之心报道

编辑：陈萍、魔王

深度学习模型的训练就像是「黑箱操作」，知道输入是什么、输出是什么，但中间过程就像个黑匣子，这使得研究人员可能花费大量时间找出模型运行不正常的原因。假如有一款可视化的工具，能够帮助研究人员更好地理解模型行为，这应该是件非常棒的事。

近日，Google 研究人员发布了一款语言可解释性工具 (Language Interpretability Tool, LIT)，这是一个开源平台，用于可视化和理解自然语言处理模型。

论文地址：https://arxiv.org/pdf/2008.05122.pdf
项目地址：https://github.com/PAIR-code/lit

LIT 重点关注模型行为的核心问题，包括：为什么模型做出这样的预测？什么时候性能不佳？在输入变化可控的情况下会发生什么？LIT 将局部解释、聚合分析和反事实生成集成到一个流线型的、基于浏览器的界面中，以实现快速探索和错误分析。

该研究支持多种自然语言处理任务，包括探索情感分析的反事实、度量共指系统中的性别偏见，以及探索文本生成中的局部行为。

此外 LIT 还支持多种模型，包括分类、seq2seq 和结构化预测模型。并且它具备高度可扩展性，可通过声明式、框架无关的 API 进行扩展。

相关 demo，参见视频：

可以针对新颖的工作流程进行重新配置，并且这些组件是独立的，可移植的，且易于实现。

用户界面

LIT 位于一个单页 web 应用中，由多个工具栏和包含多个独立模块的主体部分组成。如果模块适用于当前模型和数据集，它们将自动显示。例如，显示分类结果的模块仅在模型返回 MulticlassPreds 时显示。

LIT 用户界面

LIT 的布局设计图。

功能

LIT 通过基于浏览器的用户界面（UI）支持各种调试工作流。功能包括：

局部解释：通过模型预测的显著图、注意力和丰富可视化图来执行。
聚合分析：包括自定义度量指标、切片和装箱（slicing and binning），以及嵌入空间的可视化。
反事实生成：通过手动编辑或生成插件进行反事实推理，动态地创建和评估新示例。
并排模式：比较两个或多个模型，或基于一对示例的一个模型。
高度可扩展性：可扩展到新的模型类型，包括分类、回归、span 标注，seq2seq 和语言建模。
框架无关：与 TensorFlow、PyTorch 等兼容。

下面我们来看 LIT 的几个主要模块：

探索数据集：用户可以使用不同的标准跨模块（如数据表和嵌入模块）交互式地探索数据集，从而旋转、缩放和平移 PCA 或 UMAP 投影，以探索集群和全局结构。

比较模型：通过在全局设置控件中加载多个模型，LIT 可以对它们进行比较。然后复制显示每个模型信息的子模块，以便于在两个模型之间进行比较。其他模块（如嵌入模块和度量模块）同时得到更新，以显示所有模型的最新信息。

比较数据点：切换到选择工具栏中的「Compare datapoints」按钮，使 LIT 进入数据点比较模式。在这种模式下，主数据点选择作为参考数据点，并且在后续设置中都会以其为参考点进行比较。参考数据点在数据表中以蓝色边框突出显示。

其他模块的具体细节，参见：https://github.com/PAIR-code/lit/blob/main/docs/user_guide.md

看了上面的介绍，你是不是迫不及待地想要上手试试这个炫酷的可视化工具？下面我们来看它的安装过程和示例。

安装教程

下载软件包并进行 Python 环境配置，代码如下：

git clone https://github.com/PAIR-code/lit.git ~/lit# Set up Python environmentcd ~/litconda env create -f environment.ymlconda activate lit-nlpconda install cudnn cupti  # optional, for GPU supportconda install -c pytorch pytorch  # optional, for PyTorch# Build the frontendcd ~/lit/lit_nlp/clientyarn && yarn build

安装并配置好环境，就可以体验工具包中自带的示例。

示例

1. 情绪分类示例

代码如下：

cd ~/litpython -m lit_nlp.examples.quickstart_sst_demo --port=5432

情绪分类示例是基于斯坦福情感树库微调 BERT-tiny 模型，在 GPU 上不到 5 分钟即可完成。训练完成后，它将在开发集上启动 LIT 服务器。

2. 语言建模类示例

要想探索预训练模型（BERT 或 GPT-2）的预测结果，运行以下代码：

cd ~/litpython -m lit_nlp.examples.pretrained_lm_demo --models=bert-base-uncased \  --port=5432

更多的示例请参考目录：../lit_nlp/examples。

此外，该项目还提供了添加自己模型和数据的方法。通过创建定制的 demo.py 启动器，用户可以轻松地用自己的模型运行 LIT，类似于上述示例目录../lit_nlp/examples。

完整的添加过程，参见： https://github.com/PAIR-code/lit/blob/main/docs/python_api.md#adding-models-and-data。

参考链接：

http://www.iibrand.com/news/202008/1719096.html

https://github.com/PAIR-code/lit/blob/main/docs/user_guide.md

https://github.com/PAIR-code/lit/blob/main/docs/python_api.md#adding-models-and-data

https://medium.com/syncedreview/google-introduces-nlp-model-understanding-tool-ab840b456be3

Amazon SageMaker 是一项完全托管的服务，可以帮助开发人员和数据科学家快速构建、训练和部署机器学习模型。SageMaker完全消除了机器学习过程中每个步骤的繁重工作，让开发高质量模型变得更加轻松。

现在，企业开发者可以免费领取1000元服务抵扣券，轻松上手Amazon SageMaker，快速体验5个人工智能应用实例。

转载请联系本公众号获得授权

投稿或寻求报道：content@jiqizhixin.com

登录查看更多

相关内容

反事实

关注 9

深度学习模型可解释性的研究进展

专知会员服务

223+阅读 · 2020年8月1日

【新书册】贝叶斯神经网络，41页pdf

专知会员服务

180+阅读 · 2020年6月3日

《可解释的机器学习》中文版来了：226页pdf理解黑盒模型指南，复旦研究生翻译

专知会员服务

379+阅读 · 2020年5月10日

【Snapchat-谷歌-微软】最新《深度学习文本分类》2020综述论文大全，150+DL分类模型，42页pdf215篇参考文献

专知会员服务

84+阅读 · 2020年4月9日

TensorFlow 2.2为keras.Model加入train_step方法，开发者可自由定义模型自动训练过程

专知会员服务

36+阅读 · 2020年3月27日

【2020新书】使用Google Dialogflow构建虚拟助手对话机器人，201页pdf

专知会员服务

72+阅读 · 2020年3月19日

谷歌推出量子机器学习框架TFQ-TensorFlow Quantum，一个可训练量子模型的机器学习框架

专知会员服务

34+阅读 · 2020年3月10日

【CHI2020-微软】解释可解释性:理解数据科学家使用机器学习的可解释性工具，Interpreting Interpretability: Understanding Data Scientists’Use of Interpretability Tools for Machine Learning

专知会员服务

55+阅读 · 2020年3月8日

【CHI2020-微软】解释可解释性:理解数据科学家使用机器学习的可解释性工具

专知会员服务

103+阅读 · 2020年3月8日

【新书】学习TensorFlow2.0，177页pdf，使用Python实现机器学习和深度学习模型

专知会员服务

224+阅读 · 2019年12月28日

推断速度达seq2seq模型的100倍，谷歌开源文本生成新方法LaserTagger

机器之心

6+阅读 · 2020年2月9日

【GitHub热门开源】构建NLP深度学习模型其实就是搭积木

新智元

9+阅读 · 2019年5月11日

逆天语言模型GPT-2最新开源：345M预训练模型和1.5B参数都来了

量子位

18+阅读 · 2019年5月4日

Github项目推荐 | NeuronBlocks：微软发布的模块化深度学习NLP工具集

AI科技评论

3+阅读 · 2019年4月26日

各种NLP操作难实现？谷歌开源序列建模框架Lingvo

机器之心

4+阅读 · 2019年2月26日

谷歌最强NLP模型BERT官方中文版来了！多语言模型支持100种语言

新智元

5+阅读 · 2018年11月6日

数据标注还能更快！谷歌发布图像标注机器学习辅助工具

DeepTech深科技

8+阅读 · 2018年10月24日

最流行的6大开源自然语言处理库对比

大数据技术

8+阅读 · 2018年8月14日

用于神经网络机器翻译的全并行文本生成

专知

5+阅读 · 2018年1月3日

TensorFlow神经网络教程

Python程序员

4+阅读 · 2017年12月4日

Machine Reasoning Explainability

Arxiv

14+阅读 · 2020年9月1日

Unsupervised Domain Clusters in Pretrained Language Models

Arxiv

11+阅读 · 2020年4月5日

A Survey on Causal Inference

Arxiv

112+阅读 · 2020年2月5日

Integrating Graph Contextualized Knowledge into Pre-trained Language Models

Arxiv

5+阅读 · 2019年12月3日

Language Models as Knowledge Bases?

Arxiv

6+阅读 · 2019年9月4日

Scene-based Factored Attention for Image Captioning

Arxiv

4+阅读 · 2019年8月7日

Neural Response Generation with Meta-Words

Arxiv

6+阅读 · 2019年6月14日

What Does BERT Look At? An Analysis of BERT's Attention

Arxiv

4+阅读 · 2019年6月11日

BERT for Joint Intent Classification and Slot Filling

Arxiv

13+阅读 · 2019年2月28日

Multi-turn Dialogue Response Generation in an Adversarial Learning Framework

Arxiv

4+阅读 · 2018年6月11日

VIP会员