词法分析(英语:lexical analysis)是计算机科学中将字符序列转换为单词(Token)序列的过程。 词法分析(lexical analysis)包括汉语分词和词性标注两部分。和大部分西方语言不同,汉语书面语词语之间没有明显的空格标记,文本中的句子以字串的形式出现。 因此汉语自然语言处理的首要工作就是要将输入的字串切分为单独的词语,然后在此基础上进行其他更高级的分析,这一步骤称为分词(word segmentation 或tokenization)。除了 分词,词性标注也通常认为是词法分析的一部分。给定一个切好词的句子,词性标注的目的是为每一个词赋予一个类别,这个类别称为词性标记(part-of-speech tag),比如,名词(noun)、动词(verb)、形容词(adjective)等。
推荐几个朋友的职位
AINLP
0+阅读 · 2017年2月19日
MySQL中一条SQL语句是如何执行的?
性能与架构
1+阅读 · 2018年12月25日
分词,就这?
AINLP
2+阅读 · 2020年11月27日
让我们做个简单的解释器(一) | Linux 中国
Linux中国
0+阅读 · 2018年3月4日
人人都能读懂的编译器原理
Python开发者
0+阅读 · 2019年1月1日
Enjoy —— 极轻量级 Java 模板引擎 | 软件推介
开源中国
0+阅读 · 2017年8月7日
深入理解JavaScriptCore
美团技术团队
0+阅读 · 2018年8月23日
人人都能读懂的编译器原理
Linux爱好者
0+阅读 · 2018年12月14日
Go 编译器介绍 | Linux 中国
Linux中国
0+阅读 · 2018年9月4日
NLP航海图:自然语言处理相关任务简介
AINLP
8+阅读 · 2019年3月7日
百度中文依存句法分析工具DDParser重磅开源
深度学习自然语言处理
5+阅读 · 2020年8月6日
岗位推荐 | 腾讯招聘自然语言处理方向实习生
PaperWeekly
1+阅读 · 2018年10月17日
最全面的百度NLP自然语言处理技术解析
InfoQ
7+阅读 · 2017年11月12日
参考链接
微信扫码咨询专知VIP会员