成为VIP会员查看完整内容
VIP会员码认证
首页
主题
发现
会员
服务
注册
·
登录
词法分析
关注
204
词法分析(英语:lexical analysis)是计算机科学中将字符序列转换为单词(Token)序列的过程。 词法分析(lexical analysis)包括汉语分词和词性标注两部分。和大部分西方语言不同,汉语书面语词语之间没有明显的空格标记,文本中的句子以字串的形式出现。 因此汉语自然语言处理的首要工作就是要将输入的字串切分为单独的词语,然后在此基础上进行其他更高级的分析,这一步骤称为分词(word segmentation 或tokenization)。除了 分词,词性标注也通常认为是词法分析的一部分。给定一个切好词的句子,词性标注的目的是为每一个词赋予一个类别,这个类别称为词性标记(part-of-speech tag),比如,名词(noun)、动词(verb)、形容词(adjective)等。
综合
百科
VIP
热门
动态
论文
精华
Polarization and Morality: Lexical Analysis of Abortion Discourse on Reddit
Arxiv
0+阅读 · 6月29日
Computational lexical analysis of Flamenco genres
Arxiv
0+阅读 · 5月9日
Petit programming language and compiler
Arxiv
0+阅读 · 2023年11月24日
Towards Lexical Analysis of Dog Vocalizations via Online Videos
Arxiv
0+阅读 · 2023年9月21日
flap: A Deterministic Parser with Fused Lexing
Arxiv
0+阅读 · 2023年4月14日
flap: A Deterministic Parser with Fused Lexing
Arxiv
0+阅读 · 2023年4月13日
flap: A Deterministic Parser with Fused Lexing
Arxiv
0+阅读 · 2023年4月11日
Effect and Analysis of Large-scale Language Model Rescoring on Competitive ASR Systems
Arxiv
0+阅读 · 2022年8月18日
American cultural regions mapped through the lexical analysis of social media
Arxiv
0+阅读 · 2022年8月16日
CV4Code: Sourcecode Understanding via Visual Code Representations
Arxiv
0+阅读 · 2022年5月11日
Effect and Analysis of Large-scale Language Model Rescoring on Competitive ASR Systems
Arxiv
1+阅读 · 2022年4月1日
A Framework for Aspectual Requirements Validation: An Experimental Study
Arxiv
0+阅读 · 2021年10月8日
N-LTP: A Open-source Neural Chinese Language Technology Platform with Pretrained Models
Arxiv
0+阅读 · 2021年4月29日
Describing Console I/O Behavior for Testing Student Submissions in Haskell
Arxiv
0+阅读 · 2020年8月21日
Rethinking Text Attribute Transfer: A Lexical Analysis
Arxiv
0+阅读 · 2019年9月26日
参考链接
父主题
自然语言处理基础研究
提示
微信扫码
咨询专知VIP会员与技术项目合作
(加微信请备注: "专知")
微信扫码咨询专知VIP会员
Top