本文简绍了 HanLP 的使用方法,HanLP 是一系列模型与算法组成的 NLP 工具包,由大快搜索主导并完全开源,目前支持很多功能,项目主要是 Java 的,也支持 python,本文详细简绍 pyhanlp 的使用方法。
01
简介
HanLP 是由一系列模型与算法组成的工具包,目标是普及自然语言处理在生产环境中的应用。HanLP 具备功能完善、性能高效、架构清晰、语料时新、可自定义的特点。
HanLP 主要功能包括分词、词性标注、关键词提取、自动摘要、依存句法分析、命名实体识别、短语提取、拼音转换、简繁转换等等。
Github 地址:
https://github.com/hankcs/HanLP
官网:
http://hanlp.linrunsoft.com/
02
实战
1. 安装
2. 分词和词性标注
3.依存句法分析
4.关键词提取
5.摘要提取
6. 感知机词法分析器
7. 中国人名识别
8. 音译人名识别
9. 短语提取
10. 拼音转换
11. 繁简转换
代码已上传:
https://github.com/yuquanle/StudyForNLP/blob/master/NLPtools/HanLPDemo.ipynb
相关阅读:
作者简介
乐雨泉 (yuquanle),湖南大学在读硕士,研究方向机器学习与自然语言处理。曾在IJCAI、TASLP等会议/期刊发表文章多篇。欢迎志同道合的朋友和我在公众号"AI小白入门"一起交流学习,探讨成长。