初学者|一步步掌握FoolNLTK

2019 年 10 月 13 日 AINLP



 

本文介绍了FoolNLTK的使用方法,是一个使用双向 LSTM 构建的便捷的中文处理工具包,该工具不仅可以实现分词、词性标注和命名实体识别,同时还能使用用户自定义字典加强分词的效果。



简介



FoolNLTK是一个使用双向 LSTM 构建的便捷的中文处理工具包,该工具不仅可以实现分词、词性标注和命名实体识别,同时还能使用用户自定义字典加强分词的效果。根据该项目所述,这个中文工具包可能不是最快的开源中文分词,但很可能是最准的开源中文分词。


Github地址:https://github.com/rockyzhengwu/FoolNLTK



实战


1.安装


# 基于神经网络(BiLSTM)训练
# 可能不是最快但是最精确的中文分词工具
# 高精度的分词,词性标注,实体识别
# Java版本:https://github.com/rockyzhengwu/JFoolNLTK
# 我的安装环境:- window10 - python 3.56
# pip install foolnltk -i https://pypi.tuna.tsinghua.edu.cn/simple


2.分词


import fool
sentence = "我爱自然语言处理!"
sen_cut = (fool.cut(sentence))
print(sen_cut)

[['我', '爱', '自然', '语言', '处理', '!']]


3.词性标注


sen_cut = (fool.cut(sentence))
print(fool.pos_cut(sentence))

[[('我', 'r'), ('爱', 'v'), ('自然', 'n'), ('语言', 'n'), ('处理', 'v'), ('!', 'wt')]]


4.命名实体识别

sentence = "我想去北京学习自然语言处理!"
words, ners = fool.analysis(sentence)
print(ners)

[[(3, 6, 'location', '北京')]]


代码已上传:https://github.com/yuquanle/StudyForNLP/blob/master/NLPtools/FoolNLTKDemo.ipynb


The End

 

长按二维码关注
AI小白入门

ID:StudyForAI

学习AI学习ai(爱)

期待与您的相遇~

登录查看更多
1

相关内容

将一个汉字序列切分成一个一个单独的词
【2020新书】现代C++初学者指南,301页pdf
专知会员服务
156+阅读 · 2020年7月24日
Sklearn 与 TensorFlow 机器学习实用指南,385页pdf
专知会员服务
126+阅读 · 2020年3月15日
《深度学习》圣经花书的数学推导、原理与Python代码实现
【书籍】深度学习框架:PyTorch入门与实践(附代码)
专知会员服务
160+阅读 · 2019年10月28日
学习自然语言处理路线图
专知会员服务
133+阅读 · 2019年9月24日
一文掌握 HanLP 用法
人工智能头条
24+阅读 · 2019年5月9日
NLP - 15 分钟搭建中文文本分类模型
AINLP
79+阅读 · 2019年1月29日
在Python中使用SpaCy进行文本分类
专知
24+阅读 · 2018年5月8日
【推荐】中文处理(BiLSTM分词)工具包FoolNLTK
机器学习研究会
6+阅读 · 2017年12月27日
Python NLP入门教程
Python开发者
8+阅读 · 2017年11月19日
Arxiv
24+阅读 · 2020年3月11日
Arxiv
11+阅读 · 2018年5月13日
Arxiv
20+阅读 · 2018年1月17日
Arxiv
3+阅读 · 2017年11月20日
VIP会员
相关VIP内容
【2020新书】现代C++初学者指南,301页pdf
专知会员服务
156+阅读 · 2020年7月24日
Sklearn 与 TensorFlow 机器学习实用指南,385页pdf
专知会员服务
126+阅读 · 2020年3月15日
《深度学习》圣经花书的数学推导、原理与Python代码实现
【书籍】深度学习框架:PyTorch入门与实践(附代码)
专知会员服务
160+阅读 · 2019年10月28日
学习自然语言处理路线图
专知会员服务
133+阅读 · 2019年9月24日
相关资讯
一文掌握 HanLP 用法
人工智能头条
24+阅读 · 2019年5月9日
NLP - 15 分钟搭建中文文本分类模型
AINLP
79+阅读 · 2019年1月29日
在Python中使用SpaCy进行文本分类
专知
24+阅读 · 2018年5月8日
【推荐】中文处理(BiLSTM分词)工具包FoolNLTK
机器学习研究会
6+阅读 · 2017年12月27日
Python NLP入门教程
Python开发者
8+阅读 · 2017年11月19日
Top
微信扫码咨询专知VIP会员