BERT，GPT-2这些顶尖工具到底该怎么用到我的模型里?- 专知

BERT，GPT-2这些顶尖工具到底该怎么用到我的模型里?

【导读】近期的NLP方向，ELMO、GPT、BERT、Transformer-XL、GPT-2，各种预训练语言模型层出不穷，这些模型在各种NLP任务上一次又一次刷新上线，令人心驰神往。但是当小编翻开他们的paper，每一个上面都写着四个大字：“弱者退散”，到底该怎么将这些顶尖工具用到我的模型里呢？答案是Hugging Face的大神们开源的pytorch-pretrained-BERT。

Github 地址：

https://github.com/huggingface/pytorch-pretrained-BERT

编辑报道：

专知-huaiwen

「模型简介」

近期的各种预训练语言模型，横扫各种NLP任务，这里我们介绍三个最火的预训练模型：

BERT，由Google AI团队，发表于2018年10月11日。它的文章是： BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding。
Transformer-XL, 由Google AI和Carnegie Mellon大学，发表于2019年1月9日。它的文章是：Transformer-XL: Attentive Language Models Beyond a Fixed-Length Context。
GPT-2，由OpenAI 团队，发表于2019年2月14日，它的文章是：Language Models are Unsupervised Multitask Learners。

基本上，每一个文章，都在发表的时候，刷新当时的几乎所有NLP任务的State-of-the-Art，然后引发一波热潮。当然，目前风头正盛的是GPT-2，它前几天刚发表。

「开源实现」

然而，让小编翻开他们的paper，发现每一个上面都写着四个大字：“弱者退散”，到底该怎么将这些顶尖工具用到我的模型里呢，Hugging Face 的大神们，紧跟前沿，将所有的预训练语言模型都实现并开源了。更令人钦佩的是，它们还做了很多封装，让大家都可以才在这些巨人模型的肩膀上。

Hugging Face开源的库叫pytorch-pretained-bert, 你可以在本文开头找到链接。接下来的部分，我们介绍一下它的安装和使用。

「安装使用」

你可以直接使用 Pip install 来安装它：