自然语言处理开源书籍

2019 年 6 月 3 日 专知

作者 | duoergun0729 

Github:https://github.com/duoergun0729/nlp



NLP基础知识

  • 常用数据集简介

  • 推荐更新源

  • 打造NLP工具箱

  • 如何衡量机器学习分类模型

  • 词袋模型和TFIDF模型

  • Word2Vec模型和Doc2Vec模型

  • 自己动手训练word2vec模型

  • 使用多层感知机进行文档分类

  • 使用fasttext进行文档分类

  • 使用LDA进行文档主题建模

  • 使用Jieba进行中文词性标注

  • 使用TextRank和TFIDF进行关键字自动提取

  • 文档相似度

NLP应用案例

  • 对美食评语进行情感分析

  • https://github.com/duoergun0729/nlp/blob/master/%E9%A2%84%E6%B5%8BYelp%E7%BE%8E%E9%A3%9F%E8%AF%84%E5%88%86.md

让机器理解文字

图像、文字和声音是人类接触、理解外部世界最常见的三种形式,其中文字又是最容易保存和进行交换的形式。大量的人类文明,最终都是以文字的形式保留下来的;大量的信息交换,都是是文字的形式进行。如何能让机器可以与人交流,理解人类的思想,最终能像人类一样理解文字以及文字背后的各种想法、意图呢?自然语言处理,即所谓的NLP是重要的支撑技术。

NLP与安全

在传统的web攻防中,大家与http协议结下了不解之缘。但是在安全领域,web攻防只是很小一个分支。许多明显的与工作和生活无关的垃圾邮件,人一样就可以看出来,但是基于规则的垃圾邮件网关处理起来却总是差强人意。越来越多的电商、论坛甚至是视频网站的弹幕,总是可以看到明显的人身攻击或者违法违规信息,但是基于规则的过滤机制总是被绕过。人类可以很轻松的理解二十四口交换机,知道苹果是水果还是手机,但是机器如何做到呢?答案就是NLP。

一本开源的NLP入门书籍

作者:

这可能是第一本用开源的思想写的NLP入门书籍,整个写作过程都在我的Github上。

https://github.com/duoergun0729/nlp

之所以想用开源的思路去写,主要是因为NLP技术,尤其是基于机器学习的NLP技术发展非常快,比如目前已经广泛使用的fasttext技术,2016年发布论文,2017年已经进入大量生产领域,但是许多自然语言处理书籍还停留在大学课程的范围,甚至连词向量都很少涉及。相对周期繁琐的纸质书籍编写,在Github上我可以很方便的进行编写和更新,有勘误也可以很快修改。目前我已经完成了其中的三篇,后面我将不断更新内容。

-END-

专 · 知

专知,专业可信的人工智能知识分发,让认知协作更快更好!欢迎登录www.zhuanzhi.ai,注册登录专知,获取更多AI知识资料!

欢迎微信扫一扫加入专知人工智能知识星球群,获取最新AI专业干货知识教程视频资料和与专家交流咨询

请加专知小助手微信(扫一扫如下二维码添加),加入专知人工智能主题群,咨询技术商务合作~

专知《深度学习:算法到实战》课程全部完成!550+位同学在学习,现在报名,限时优惠!网易云课堂人工智能畅销榜首位!

点击“阅读原文”,了解报名专知《深度学习:算法到实战》课程

登录查看更多
2

相关内容

NLP:自然语言处理
【Manning新书】现代Java实战,592页pdf
专知会员服务
101+阅读 · 2020年5月22日
专知会员服务
201+阅读 · 2020年3月6日
【2020新书】数据科学:十大Python项目,247页pdf
专知会员服务
216+阅读 · 2020年2月21日
【书籍】深度学习框架:PyTorch入门与实践(附代码)
专知会员服务
167+阅读 · 2019年10月28日
李沐《动手学深度学习》, PyTorch 版源代码已开源,附书籍和代码下载链接
【赠书】TensorFlow自然语言处理
AINLP
17+阅读 · 2019年7月14日
中文自然语言处理入门实战
人工智能头条
16+阅读 · 2019年1月11日
自然语言处理NLP快速入门
专知
20+阅读 · 2018年10月8日
干货 | 自然语言处理入门资料推荐
机器学习算法与Python学习
14+阅读 · 2018年1月2日
综述 | 一文读懂自然语言处理NLP(附学习资料)
PaperWeekly
9+阅读 · 2017年11月14日
独家 | 一文读懂自然语言处理NLP(附学习资料)
数据派THU
9+阅读 · 2017年10月11日
推荐几本学习自然语言处理相关的书籍
AINLP
7+阅读 · 2016年10月12日
Question Generation by Transformers
Arxiv
5+阅读 · 2019年9月14日
Arxiv
3+阅读 · 2019年9月5日
Arxiv
9+阅读 · 2019年4月19日
Arxiv
22+阅读 · 2018年8月30日
Arxiv
11+阅读 · 2017年11月22日
VIP会员
相关资讯
李沐《动手学深度学习》, PyTorch 版源代码已开源,附书籍和代码下载链接
【赠书】TensorFlow自然语言处理
AINLP
17+阅读 · 2019年7月14日
中文自然语言处理入门实战
人工智能头条
16+阅读 · 2019年1月11日
自然语言处理NLP快速入门
专知
20+阅读 · 2018年10月8日
干货 | 自然语言处理入门资料推荐
机器学习算法与Python学习
14+阅读 · 2018年1月2日
综述 | 一文读懂自然语言处理NLP(附学习资料)
PaperWeekly
9+阅读 · 2017年11月14日
独家 | 一文读懂自然语言处理NLP(附学习资料)
数据派THU
9+阅读 · 2017年10月11日
推荐几本学习自然语言处理相关的书籍
AINLP
7+阅读 · 2016年10月12日
相关论文
Question Generation by Transformers
Arxiv
5+阅读 · 2019年9月14日
Arxiv
3+阅读 · 2019年9月5日
Arxiv
9+阅读 · 2019年4月19日
Arxiv
22+阅读 · 2018年8月30日
Arxiv
11+阅读 · 2017年11月22日
Top
微信扫码咨询专知VIP会员