GitHub获赞过千：PyTorch 自然语言处理项目Top 5 - 专知

会员服务 ·

1

GitHub获赞过千：PyTorch 自然语言处理项目Top 5

2018 年 7 月 10 日 新智元

新智元推荐

来源：专知

作者：Huaiwen

【新智元导读】Github 上有许多成熟的 PyTorch NLP 代码和模型，可以直接用于科研和工程中。本文介绍其中一下 Star 过千的时下热点项目。

AllenNLP 2504 Star

https://github.com/allenai/allennlp

AllenNLP，是AI2公司家的开源项目，致力于成为 PyTorch 下 NLP 算法研究和实现的全能平台。AllenNLP 的设计理念是: 模块化和轻量级。它将 NLP中个各种需求进行了非常好的封装，包括：padding, masking 等等。特别的，AllenNLP 对实验非常友好，实验流程和参数有Json文件配置，并行、重现完全不是问题，而且每一步都有丰富的 log 记录你想记录的一切。

AllenNLP 自身实现了包括：命名实体识别、语义角色标注、阅读理解在内的多种常用算法。AllenNLP是由艾伦人工智能研究所(Allen Institute for Artificial Intelligence)与华盛顿大学(University of Washington)和其他机构的研究人员密切合作建立和维护的。

DrQA 2374 Star

https://github.com/facebookresearch/DrQA

DrQA 是 facebook 开源的开放式阅读理解智能问答算法。原论文发布在 ACL2016上，名字是：Reading Wikipedia to Answer Open-Domain Questions

链接：

http://www.zhuanzhi.ai/paper/ec2483da392a7e054eeb0f0a58d3ddee。

DrQA是一个用于阅读理解的系统，适用于开放领域的问答。特别是，DrQA致力于解决大规模机器阅读理解。在这种情况下，算法在一个非常大的非结构化文档语料库中寻找问题的答案。因此，系统必须将文档检索(查找相关文档)与文本的机器理解(识别来自这些文档的答案)结合起来。

faieseq 1711 Star

https://github.com/pytorch/fairseq

fairseq是facebook 开源的一个序列建模工具包，而并不是单纯的某个模型的实现。

它允许研究人员和开发人员为机器翻译、自动摘要、语言模型和其他文本生成任务训练自定义模型。它提供了各种Seq2seq 的模型的实现，包括:

Convolutional Neural Networks (CNN)

Dauphin et al. (2017): Language Modeling with Gated Convolutional Networks
Gehring et al. (2017): Convolutional Sequence to Sequence Learning
New Edunov et al. (2018): Classical Structured Prediction Losses for Sequence to Sequence Learning
New Fan et al. (2018): Hierarchical Neural Story Generation

Long Short-Term Memory (LSTM) networks

Luong et al. (2015): Effective Approaches to Attention-based Neural Machine Translation
Wiseman and Rush (2016): Sequence-to-Sequence Learning as Beam-Search Optimization

Transformer (self-attention) networks

Vaswani et al. (2017): Attention Is All You Need
New Ott et al. (2018): Scaling Neural Machine Translation

OpenNMT-py 1558 Star

https://github.com/OpenNMT/OpenNMT-py

OpenNMT 全称是Open Source Neural Machine Translation in PyTorch (PyTorch 开源神经翻译模型)，致力于研究促进新idea 在神经翻译，自动摘要，看图说话，语言形态学和许多其他领域的发展。

作为自动翻译的平台型项目， OpenNMT 当然也支持各种文本数据预处理，包括各种 RNN 单元，各种 attention机制，花式日志，语音转文本，看图说话等等。

DeepNLP-models-Pytorch 1256 Star

https://github.com/DSKSD/DeepNLP-models-Pytorch

最后，给大家介绍的是DeepNLP-models in PyTorch。这个库，是韩国的Kim Sungdong同学，在看完 CS224的课后，用 PyTorch 将其中的模型都实现了一遍，包括：

【加入社群】

新智元 AI 技术 + 产业社群招募中，欢迎对 AI 技术 + 产业落地感兴趣的同学，加小助手微信号: aiera2015_3 入群；通过审核后我们将邀请进群，加入社群后务必修改群备注（姓名 - 公司 - 职位；专业群审核较严，敬请谅解）。

登录查看更多

12

相关内容

DrQA

深度学习自然语言处理概述，216页ppt，Jindřich Helcl

深度学习自然语言处理概述，216页ppt，Jindřich Helcl

专知会员服务

216+阅读 · 2020年4月26日

Yann Lecun 纽约大学《深度学习(PyTorch)》课程(2020）PPT

Yann Lecun 纽约大学《深度学习(PyTorch)》课程(2020）PPT

专知会员服务

183+阅读 · 2020年3月16日

近期必读的7篇 CVPR 2019【视觉问答】相关论文和代码

近期必读的7篇 CVPR 2019【视觉问答】相关论文和代码

专知会员服务

37+阅读 · 2020年1月10日

近期必读的10篇ACL 2019【图神经网络（GNN）+NLP】相关论文和代码

专知会员服务

71+阅读 · 2020年1月10日

科技部发布「科技创新2030—“新一代人工智能”重大项目」2020年度第一批项目申报指南征求意见

科技部发布「科技创新2030—“新一代人工智能”重大项目」2020年度第一批项目申报指南征求意见

专知会员服务

95+阅读 · 2020年1月3日

一网打尽！100+深度学习模型TensorFlow与Pytorch代码实现集合

一网打尽！100+深度学习模型TensorFlow与Pytorch代码实现集合

专知会员服务

142+阅读 · 2020年1月3日

【课程推荐】普林斯顿陈丹琦COS 484: 自然语言处理课程

【课程推荐】普林斯顿陈丹琦COS 484: 自然语言处理课程

专知会员服务

85+阅读 · 2019年12月11日

【精通OpenCV 4】Mastering OpenCV 4 - Third Edition 随书代码

【精通OpenCV 4】Mastering OpenCV 4 - Third Edition 随书代码

专知会员服务

40+阅读 · 2019年11月13日

阅读理解中的推理和符号机制[吕正东]CCKS ATT 16-2019

阅读理解中的推理和符号机制[吕正东]CCKS ATT 16-2019

专知会员服务

17+阅读 · 2019年10月25日

计算机视觉最佳实践、代码示例和相关文档

计算机视觉最佳实践、代码示例和相关文档

专知会员服务

20+阅读 · 2019年10月9日

【Github】nlp-tutorial：TensorFlow 和 PyTorch 实现各种NLP模型

【Github】nlp-tutorial：TensorFlow 和 PyTorch 实现各种NLP模型

AINLP

14+阅读 · 2019年9月4日

【Github】All4NLP：自然语言处理相关资源整理

【Github】All4NLP：自然语言处理相关资源整理

AINLP

23+阅读 · 2019年8月9日

Github项目推荐 | DeepHash - 深度学习哈希开源库

Github项目推荐 | DeepHash - 深度学习哈希开源库

AI研习社

26+阅读 · 2019年4月30日

基于PyTorch/TorchText的自然语言处理库

基于PyTorch/TorchText的自然语言处理库

专知

28+阅读 · 2019年4月22日

【GitHub项目推荐】文本分类最好的几个深度学习方法 TensorFlow 实践

【GitHub项目推荐】文本分类最好的几个深度学习方法 TensorFlow 实践

专知

39+阅读 · 2018年11月27日

【Github 3.5K 星】PyTorch资源列表：450个NLP/CV/SP、论文实现、库、教程&示例

【Github 3.5K 星】PyTorch资源列表：450个NLP/CV/SP、论文实现、库、教程&示例

七月在线实验室

10+阅读 · 2018年10月25日

近期值得关注的8款AI开源项目 | 本周Github精选

近期值得关注的8款AI开源项目 | 本周Github精选

PaperWeekly

4+阅读 · 2018年8月3日

Github 上 Star 过千的 PyTorch NLP 相关项目

Github 上 Star 过千的 PyTorch NLP 相关项目

专知

3+阅读 · 2018年7月5日

Facebook AI发布新版本FairSeq序列到序列(Seq2Seq)学习工具，可生成故事与快速推断

Facebook AI发布新版本FairSeq序列到序列(Seq2Seq)学习工具，可生成故事与快速推断

专知

23+阅读 · 2018年6月17日

开发 | Facebook开源 PyTorch版 fairseq，准确性最高、速度比循环神经网络快9倍

开发 | Facebook开源 PyTorch版 fairseq，准确性最高、速度比循环神经网络快9倍

AI科技评论

6+阅读 · 2017年9月19日

Transformer based Grapheme-to-Phoneme Conversion

Arxiv

6+阅读 · 2020年4月14日

ESRGAN: Enhanced Super-Resolution Generative Adversarial Networks

ESRGAN: Enhanced Super-Resolution Generative Adversarial Networks

Arxiv

6+阅读 · 2018年9月17日

Comparative Analysis of Neural QA models on SQuAD

Arxiv

6+阅读 · 2018年6月18日

Scaling Neural Machine Translation

Arxiv

3+阅读 · 2018年6月1日

Question Answering through Transfer Learning from Large Fine-grained Supervision Data

Arxiv

3+阅读 · 2018年5月31日

Universal Language Model Fine-tuning for Text Classification

Arxiv

3+阅读 · 2018年5月23日

QANet: Combining Local Convolution with Global Self-Attention for Reading Comprehension

Arxiv

4+阅读 · 2018年4月23日

Generate To Adapt: Aligning Domains using Generative Adversarial Networks

Arxiv

4+阅读 · 2018年4月1日

SEARNN: Training RNNs with Global-Local Losses

Arxiv

5+阅读 · 2018年1月29日

A Deep Reinforcement Learning Chatbot (Short Version)

Arxiv

13+阅读 · 2018年1月20日

VIP会员

相关主题

机器阅读理解

自然语言处理

相关VIP内容

深度学习自然语言处理概述，216页ppt，Jindřich Helcl

深度学习自然语言处理概述，216页ppt，Jindřich Helcl

专知会员服务

216+阅读 · 2020年4月26日

Yann Lecun 纽约大学《深度学习(PyTorch)》课程(2020）PPT

Yann Lecun 纽约大学《深度学习(PyTorch)》课程(2020）PPT

专知会员服务

183+阅读 · 2020年3月16日

近期必读的7篇 CVPR 2019【视觉问答】相关论文和代码

近期必读的7篇 CVPR 2019【视觉问答】相关论文和代码

专知会员服务

37+阅读 · 2020年1月10日

近期必读的10篇ACL 2019【图神经网络（GNN）+NLP】相关论文和代码

专知会员服务

71+阅读 · 2020年1月10日

科技部发布「科技创新2030—“新一代人工智能”重大项目」2020年度第一批项目申报指南征求意见

科技部发布「科技创新2030—“新一代人工智能”重大项目」2020年度第一批项目申报指南征求意见

专知会员服务

95+阅读 · 2020年1月3日

一网打尽！100+深度学习模型TensorFlow与Pytorch代码实现集合

一网打尽！100+深度学习模型TensorFlow与Pytorch代码实现集合

专知会员服务

142+阅读 · 2020年1月3日

【课程推荐】普林斯顿陈丹琦COS 484: 自然语言处理课程

【课程推荐】普林斯顿陈丹琦COS 484: 自然语言处理课程

专知会员服务

85+阅读 · 2019年12月11日

【精通OpenCV 4】Mastering OpenCV 4 - Third Edition 随书代码

【精通OpenCV 4】Mastering OpenCV 4 - Third Edition 随书代码

专知会员服务

40+阅读 · 2019年11月13日

阅读理解中的推理和符号机制[吕正东]CCKS ATT 16-2019

阅读理解中的推理和符号机制[吕正东]CCKS ATT 16-2019

专知会员服务

17+阅读 · 2019年10月25日

计算机视觉最佳实践、代码示例和相关文档

计算机视觉最佳实践、代码示例和相关文档

专知会员服务

20+阅读 · 2019年10月9日

热门VIP内容

开通专知VIP会员享更多权益服务

操作系统智能体：基于多模态大模型（MLLM）的通用计算设备智能体综述

《美国太空军系统全生命周期建模、仿真与分析效能提升方案》最新84页报告

【博士论文】推进数据高效的深度学习：非参数 Transformer、主动测试与上下文学习

自主人工智能：未来战争是否将是自主化的？

相关资讯

【Github】nlp-tutorial：TensorFlow 和 PyTorch 实现各种NLP模型

【Github】nlp-tutorial：TensorFlow 和 PyTorch 实现各种NLP模型

AINLP

14+阅读 · 2019年9月4日

【Github】All4NLP：自然语言处理相关资源整理

【Github】All4NLP：自然语言处理相关资源整理

AINLP

23+阅读 · 2019年8月9日

Github项目推荐 | DeepHash - 深度学习哈希开源库

Github项目推荐 | DeepHash - 深度学习哈希开源库

AI研习社

26+阅读 · 2019年4月30日

基于PyTorch/TorchText的自然语言处理库

基于PyTorch/TorchText的自然语言处理库

专知

28+阅读 · 2019年4月22日

【GitHub项目推荐】文本分类最好的几个深度学习方法 TensorFlow 实践

【GitHub项目推荐】文本分类最好的几个深度学习方法 TensorFlow 实践

专知

39+阅读 · 2018年11月27日

【Github 3.5K 星】PyTorch资源列表：450个NLP/CV/SP、论文实现、库、教程&示例

【Github 3.5K 星】PyTorch资源列表：450个NLP/CV/SP、论文实现、库、教程&示例

七月在线实验室

10+阅读 · 2018年10月25日

近期值得关注的8款AI开源项目 | 本周Github精选

近期值得关注的8款AI开源项目 | 本周Github精选

PaperWeekly

4+阅读 · 2018年8月3日

Github 上 Star 过千的 PyTorch NLP 相关项目

Github 上 Star 过千的 PyTorch NLP 相关项目

专知

3+阅读 · 2018年7月5日

Facebook AI发布新版本FairSeq序列到序列(Seq2Seq)学习工具，可生成故事与快速推断

Facebook AI发布新版本FairSeq序列到序列(Seq2Seq)学习工具，可生成故事与快速推断

专知

23+阅读 · 2018年6月17日

开发 | Facebook开源 PyTorch版 fairseq，准确性最高、速度比循环神经网络快9倍

开发 | Facebook开源 PyTorch版 fairseq，准确性最高、速度比循环神经网络快9倍

AI科技评论

6+阅读 · 2017年9月19日

相关论文

Transformer based Grapheme-to-Phoneme Conversion

Arxiv

6+阅读 · 2020年4月14日

ESRGAN: Enhanced Super-Resolution Generative Adversarial Networks

ESRGAN: Enhanced Super-Resolution Generative Adversarial Networks

Arxiv

6+阅读 · 2018年9月17日

Comparative Analysis of Neural QA models on SQuAD

Arxiv

6+阅读 · 2018年6月18日

Scaling Neural Machine Translation

Arxiv

3+阅读 · 2018年6月1日

Question Answering through Transfer Learning from Large Fine-grained Supervision Data

Arxiv

3+阅读 · 2018年5月31日

Universal Language Model Fine-tuning for Text Classification

Arxiv

3+阅读 · 2018年5月23日

QANet: Combining Local Convolution with Global Self-Attention for Reading Comprehension

Arxiv

4+阅读 · 2018年4月23日

Generate To Adapt: Aligning Domains using Generative Adversarial Networks

Arxiv

4+阅读 · 2018年4月1日

SEARNN: Training RNNs with Global-Local Losses

Arxiv

5+阅读 · 2018年1月29日

A Deep Reinforcement Learning Chatbot (Short Version)

Arxiv

13+阅读 · 2018年1月20日

大家都在搜

大型语言模型

CMU博士论文

国防科技创新

无人机测控通信自组网技术综述

微信扫码咨询专知VIP会员