一个API调用27个NLP预训练模型：BERT、GPT-2全囊括，像导入NumPy一样容易

会员服务 ·

一个API调用27个NLP预训练模型：BERT、GPT-2全囊括，像导入NumPy一样容易

2019 年 7 月 17 日 量子位

鱼羊发自凹非寺
量子位报道 | 公众号 QbitAI

只需一个API，就能调用BERT、XLM等多种语言模型，逆天的GPT-2也一样轻松到碗里来，这样的模型库你是否期待？

现在，真的有人完成了这一惊人工作，推出了堪称最先进的自然语言处理预训练模型库。

六种架构，27个预训练模型，简单易用，鹅妹子嘤。

其名为Pytorch-Transformers 1.0。

登场数小时，获赞1000+，网友忍不住惊叹：这简直就是上帝的工作。

Pytorch-Transformers 1.0

从模型分析到生产加速，对自然语言处理研究人员来说，简直是一库在手，天下我有。

目前这个库中包含PyTorch实现，预训练模型权重，数据集和六个模型的转换工具。

六种NLP模型

库中囊括了现在自然语言处理（NLP）领域最常用的六种模型：

BERT
GPT
GPT-2
Transformer-XL
XLNet
XLM

这些实现已经在GLUE、SQuAD上进行了测试，基本能与原始实现的性能相匹配。

△BERT原始实现性能

△Pytorch-Transformers 1.0中BERT实现性能

27个预训练模型

快速上手

这么强大的工具，上手也很简单。

作者已经在Python 2.7和 3.5+上进行过测试，PyTorch的版本则是 0.4.1到 1.1.0。

首先pip一下：

pip install pytorch-transformers

克隆储存库并运行：

pip install [--editable] .

可以用pytest进行一些测试：

python -m pytest -sv ./pytorch_transformers/tests/
python -m pytest -sv ./examples/

接着，就可以看一下快速入门示例了。

BERT：

首先，使用BertTokenizer从文本字符串中准备一个标记化的输入：

使用BertModel在隐藏状态下编码输入：

用BertForMaskedLM预测masked token：

OpenAI GPT-2

准备输入：

预测下一句：

就像这样，每一个模型都有相应的示例，可以在文档中查看详情。

不懂法律的物理学博士不是好工程师

Pytorch-Transformers 1.0的作者小哥是一位真正的跨界人才。

10岁学编程，大学却入了物理坑。

第一份工作是在劳伦斯伯克利国家实验室的BELLA中心研究激光等离子体相互作用。

被麻省理工录取为博士研究生，最后在索邦大学和ESPCI（巴黎高等物理化工学院）拿到了量子物理学博士学位。

在这之后，他又转行去知识产权律师事务所当起了欧洲专利律师。

现在，他在创业公司Huggingface Inc. 领导一支科学团队，致力于自然语言生成和自然语言理解领域。

真乃神人也。

传送门

开源地址：
https://github.com/huggingface/pytorch-transformers

教程文档：
https://huggingface.co/pytorch-transformers/quickstart.html#documentation

— 完 —

AI社群 | 与优秀的人交流

小程序 | 全类别AI学习教程

量子位 QbitAI · 头条号签约作者

վ'ᴗ' ի 追踪AI技术和产品新动态

喜欢就点「在看」吧 !

登录查看更多

相关内容

GPT-2

关注 0

Yann Lecun 纽约大学《深度学习(PyTorch)》课程(2020）PPT

专知会员服务

184+阅读 · 2020年3月16日

谷歌提出“T5” 新NLP模型，突破迁移学习局限，多基准测试达SOTA！

专知会员服务

41+阅读 · 2020年2月26日

【微软亚洲研究院】CodeBERT:用于编程和自然语言的预训练模型，CodeBERT: A Pre-Trained Model for Programming and Natural Languages

专知会员服务

32+阅读 · 2020年2月21日

Transformer文本分类代码

专知会员服务

118+阅读 · 2020年2月3日

预训练语言模型BERT，Jacob Devlin斯坦福演讲PPT：BERT介绍与答疑，35页ppt

专知会员服务

115+阅读 · 2020年1月7日

预训练语言模型究竟捕获了什么？（oLMpics - On what Language Model Pre-training Captures）

专知会员服务

14+阅读 · 2020年1月3日

【干货】用BRET进行多标签文本分类（附代码）

专知会员服务

85+阅读 · 2019年12月27日

【ICLR2020 预训练的百科全书】弱监督的知识-预训练的语言模型（PRETRAINED ENCYCLOPEDIA: WEAKLY SUPERVISED KNOWLEDGE-PRETRAINED LANGUAGE MODEL）

专知会员服务

25+阅读 · 2019年12月26日

【文章|BERT三步使用NLP迁移学习】NLP Transfer Learning In 3 Steps

专知会员服务

51+阅读 · 2019年11月26日

【CCL 2019】ATT-第19期：预训练模型--自然语言处理的新范式（车万翔）

专知会员服务

41+阅读 · 2019年11月12日

RoBERTa中文预训练模型，你离中文任务的「SOTA」只差个它

机器之心

40+阅读 · 2019年9月5日

最强NLP预训练模型库PyTorch-Transformers正式开源！支持6个预训练框架，27个预训练模型

AI前线

12+阅读 · 2019年7月22日

GitHub超9千星：一个API调用27个NLP预训练模型

新智元

17+阅读 · 2019年7月22日

想在PyTorch里训练BERT，请试试Facebook跨语言模型XLM

量子位

3+阅读 · 2019年6月23日

谷歌“史上最强GAN”，现在有了PyTorch预训练版，可直接玩耍 | 代码

量子位

16+阅读 · 2019年3月22日

加入Transformer-XL，这个PyTorch包能调用各种NLP预训练模型

机器之心

15+阅读 · 2019年2月13日

最强NLP模型BERT喜迎PyTorch版！谷歌官方推荐，也会支持中文

量子位

13+阅读 · 2018年11月7日

韩国小哥哥用Pytorch实现谷歌最强NLP预训练模型BERT | 代码

量子位

8+阅读 · 2018年10月19日

资源 | 最强预训练模型BERT的Pytorch实现（非官方）

全球人工智能

7+阅读 · 2018年10月18日

Github项目推荐 | 用于自然语言处理的开源 Python 库 —— PyTorch-NLP

AI研习社

9+阅读 · 2018年3月20日

Pre-trained Models for Natural Language Processing: A Survey

Arxiv

113+阅读 · 2020年3月18日

Data Augmentation using Pre-trained Transformer Models

Arxiv

17+阅读 · 2020年3月4日

Language Modeling with Deep Transformers

Arxiv

6+阅读 · 2019年7月11日

Fine-tune BERT for Extractive Summarization

Arxiv

21+阅读 · 2019年3月25日

Universal Transformers

Arxiv

5+阅读 · 2019年3月5日

The Evolved Transformer

Arxiv

5+阅读 · 2019年1月30日

Conditional BERT Contextual Augmentation

Arxiv

8+阅读 · 2018年12月17日

Scaling Neural Machine Translation

Arxiv

3+阅读 · 2018年6月1日

Complex Relations in a Deep Structured Prediction Model for Fine Image Segmentation

Arxiv

7+阅读 · 2018年5月24日

Universal Language Model Fine-tuning for Text Classification

Arxiv

3+阅读 · 2018年5月17日

VIP会员