NLP 新手必看!这是一份覆盖全面的基于 PyTorch 和 keras 的 NLP 学习教程

2019 年 3 月 29 日 雷锋网

▲点击上方 雷锋网 关注


作为人工智能领域「皇冠上的明珠」,NLP 技术经历了几年的发展后,证明了落地的可行性。

 文 | 王雪佩 

雷锋网 AI 科技评论按,人工智能技术目前越来越火爆,近日,2018 年图灵奖得主揭晓,获奖的三位科学家是分别是 Yoshua Bengio、Yann LeCun 和 Geoffrey Hinton。相信在人工智能领域,没有人不知道这三位,众所周知,他们被称为「深度学习三巨头」。

作为人工智能领域「皇冠上的明珠」,NLP 技术在经历了过去几年的发展之后,证明了它落地的可行性,因此目前也是相当火爆。想必同学们也会经常在网上找一些好的学习资源。

最近,小编在 github 上发现了一份基于 的 NLP 学习教程。这份教程内容相当丰富,内容涵盖神经网络机器翻译、问答匹配、电影评价分类、新闻分类等多个领域。

项目的 GitHub 地址为:https://github.com/lyeoni/nlp-tutorial。

这是一个教你逐步实现和适应简单的实词 NLP 任务的教程:

项目里面有 4 个资源:神经机器翻译、问答匹配、新闻分类和电影分级。这些资源都提供了源码,对初学者来说,极为友好。初学者可以学会建立自己的模型。

废话就不多说了,让我们一起来具体看看这些资源吧~

神经机器翻译:这个 repo 提供了神经机器翻译的简单 PyTorch 实现,以及机器翻译过程中各种序列到序列(seq2seq)模型的比较。

  • 关键词:序列到序列网络(seq2seq),注意机制,自回归,Teacher-forcing

问答匹配:这个 repo 提供了简单的 PyTorch 问答匹配实现。在这里,我们使用来自 Stack Exchange 的英语语料库来构建整个问题的嵌入。使用这些嵌入,我们找到给定问题的类似问题,并找到相应的答案。

  • 关键词: 长度可变的 LSTM 序列,TF-IDF,文本分类

新闻分类:此报告包含一个简单的源代码,用于基于 textcn 的文本分类。语料库是英文的赫夫波斯特新闻分类数据集。大多数开放源代码对于初学者来说有点难以学习和建立文本分类模型。所以,我希望这个 repo 对于那些想要拥有自己的文本分类模型的人来说是一个很好的解决方案。

  • 关键词:textcn,文本分类,文本分类

电影分级(韩国 NLP):此 repo 包含一个简单的源代码,用于基于 TextCNN 的文本分类任务中。其语料库是 Huffpost 的新闻分类数据集。对初学者来说,学习大多数开放源代码、建立文本分类模型是有难度的。所以,我希望这个 repo 可以帮助他们拥有自己的文本分类模型。

  • 关键词:TextCNN、文本分类、情感分析

如果在学习中遇到相关问题,还可以点击下面的网址,加入小组答疑:https://github.com/lyeoni/nlp-tutorial/tree/master/question-answering-SQuAD

拥有这么好的资源,同学们赶快开始学习吧!

via:https://github.com/lyeoni/nlp-tutorial

- END -

  ◆  


推荐阅读


美团涉垄断遭处罚:强制商家二选一;AI 三巨头获 2018 年图灵奖;人类第六感首次被证实

扒一扒华为在英国买500英亩地要建的“光芯片”工厂

深航App劫持微信;Apple News上线首日遭遇各种崩溃;华为P30“望远镜手机”正式发布

重磅!苹果迎来史上最大转型: Apple Card 加持,四大新品齐亮相

滴滴回应网约车司机遇害;新 iPhone 或支持双向无线充电;阿里巴巴收购以色列AR 公司

登录查看更多
3

相关内容

NLP:自然语言处理
【DeepMind推荐】居家学习的人工智能干货资源大全集
专知会员服务
108+阅读 · 2020年6月27日
深度学习自然语言处理概述,216页ppt,Jindřich Helcl
专知会员服务
212+阅读 · 2020年4月26日
【WWW2020】DGL深度图神经网络实战教程,PPT+代码
专知会员服务
175+阅读 · 2020年4月12日
一网打尽!100+深度学习模型TensorFlow与Pytorch代码实现集合
六篇 EMNLP 2019【图神经网络(GNN)+NLP】相关论文
专知会员服务
71+阅读 · 2019年11月3日
【书籍】深度学习框架:PyTorch入门与实践(附代码)
专知会员服务
163+阅读 · 2019年10月28日
TensorFlow 2.0 学习资源汇总
专知会员服务
66+阅读 · 2019年10月9日
GAN新书《生成式深度学习》,Generative Deep Learning,379页pdf
专知会员服务
202+阅读 · 2019年9月30日
【资源】NLP多标签文本分类代码实现工具包
专知
40+阅读 · 2019年11月20日
【干货】史上最全的PyTorch学习资源汇总
深度学习与NLP
24+阅读 · 2019年5月18日
超全的PyTorch学习资源汇总
机器学习算法与Python学习
20+阅读 · 2019年5月13日
Github库分享:超全的PyTorch学习资源汇总
专知
21+阅读 · 2019年5月9日
十分钟掌握Keras实现RNN的seq2seq学习
机器学习研究会
10+阅读 · 2017年10月13日
A Modern Introduction to Online Learning
Arxiv
20+阅读 · 2019年12月31日
Multi-task Deep Reinforcement Learning with PopArt
Arxiv
4+阅读 · 2018年9月12日
Arxiv
22+阅读 · 2018年8月30日
Arxiv
19+阅读 · 2018年3月28日
Arxiv
3+阅读 · 2018年3月27日
VIP会员
相关VIP内容
【DeepMind推荐】居家学习的人工智能干货资源大全集
专知会员服务
108+阅读 · 2020年6月27日
深度学习自然语言处理概述,216页ppt,Jindřich Helcl
专知会员服务
212+阅读 · 2020年4月26日
【WWW2020】DGL深度图神经网络实战教程,PPT+代码
专知会员服务
175+阅读 · 2020年4月12日
一网打尽!100+深度学习模型TensorFlow与Pytorch代码实现集合
六篇 EMNLP 2019【图神经网络(GNN)+NLP】相关论文
专知会员服务
71+阅读 · 2019年11月3日
【书籍】深度学习框架:PyTorch入门与实践(附代码)
专知会员服务
163+阅读 · 2019年10月28日
TensorFlow 2.0 学习资源汇总
专知会员服务
66+阅读 · 2019年10月9日
GAN新书《生成式深度学习》,Generative Deep Learning,379页pdf
专知会员服务
202+阅读 · 2019年9月30日
相关资讯
【资源】NLP多标签文本分类代码实现工具包
专知
40+阅读 · 2019年11月20日
【干货】史上最全的PyTorch学习资源汇总
深度学习与NLP
24+阅读 · 2019年5月18日
超全的PyTorch学习资源汇总
机器学习算法与Python学习
20+阅读 · 2019年5月13日
Github库分享:超全的PyTorch学习资源汇总
专知
21+阅读 · 2019年5月9日
十分钟掌握Keras实现RNN的seq2seq学习
机器学习研究会
10+阅读 · 2017年10月13日
Top
微信扫码咨询专知VIP会员