“语言标注是自然语言处理的关键环节,但是它很少在计算语言学课程中被提及。这是第一本手把手讲解标注的书籍,从规范和设计到使用机器学习算法面面俱到。它必然成为本科和研究生的计算语言学课程的范本。” ——Nancy Ide Vassar学院的计算机科学教授

是时候创建属于你自己的用于机器学习的自然语言训练语料库了。无论你使用英语、汉语或者其他任何一种自然语言,本书都可以手把手地指导你一种经验证的标注开发周期——把元语添加到你的训练语料库中来帮助机器学习算法更有效工作的过程。你无需任何编程或者语言学方面的经验就可以上手。

通过每一步中的详细示例,你将学到“标注开发过程”是如何帮助你建模、标注、训练、测试、评估和修正你的训练语料库。你也将了解到一个实际标注项目的完整演示。

在收集你的数据集(语料库)之前定义一个清晰的标注目标 学习用于分析你的语料库中语言内容的工具 搭建用于你的标注项目的模型和规范 检查从基本的XML到语言标记框架这样一些不同的标注格式 创建适合于训练和测试机器学习算法的黄金标准语料库

选择用来处理你的标注数据的机器学习算法 评估测试结果并修正你的标注任务 学习如何使用用于标注文本和调整标注的轻量级软件

James Pustejovsky是Brandeis大学的教授,他在该大学的计算机科学系讲解和研究人工智能及计算语言学。

Amber Stubbs刚刚获得了Brandeis大学标注方法论的博士学位。她现在是SUNY Albany大学的博士后。

成为VIP会员查看完整内容
52

相关内容

【斯坦福经典书】机器学习导论,188页pdf
专知会员服务
77+阅读 · 2021年3月31日
【经典书】数理统计学,142页pdf
专知会员服务
96+阅读 · 2021年3月25日
【经典书】信息论原理,774页pdf
专知会员服务
255+阅读 · 2021年3月22日
【干货书】Python机器学习,361页pdf
专知会员服务
266+阅读 · 2021年2月25日
【经典书】统计强化学习:现代机器学习方法,206页pdf
专知会员服务
78+阅读 · 2021年2月24日
【经典书】精通Linux,394页pdf
专知会员服务
92+阅读 · 2021年2月19日
【干货书】面向机器学习的自然语言标注,341页pdf
专知会员服务
67+阅读 · 2021年2月7日
【经典书】操作系统导论,687页pdf
专知会员服务
171+阅读 · 2020年10月28日
【经典书】Python金融大数据分析,566页pdf
专知会员服务
122+阅读 · 2020年8月1日
机器学习速查手册,135页pdf
专知会员服务
340+阅读 · 2020年3月15日
关于机器学习你要了解的 5 件事
机器学习算法与Python学习
7+阅读 · 2018年9月7日
最适合机器学习新手的10种算法
论智
9+阅读 · 2018年1月23日
Python & 机器学习之项目实践 | 赠书
人工智能头条
14+阅读 · 2017年12月26日
机器学习翻译基本原理
论智
5+阅读 · 2017年12月21日
机器学习必备手册
机器学习研究会
19+阅读 · 2017年10月24日
Arxiv
0+阅读 · 2021年4月6日
Arxiv
5+阅读 · 2020年3月16日
Arxiv
3+阅读 · 2019年8月19日
Arxiv
6+阅读 · 2019年7月11日
Arxiv
6+阅读 · 2018年1月11日
VIP会员
相关VIP内容
【斯坦福经典书】机器学习导论,188页pdf
专知会员服务
77+阅读 · 2021年3月31日
【经典书】数理统计学,142页pdf
专知会员服务
96+阅读 · 2021年3月25日
【经典书】信息论原理,774页pdf
专知会员服务
255+阅读 · 2021年3月22日
【干货书】Python机器学习,361页pdf
专知会员服务
266+阅读 · 2021年2月25日
【经典书】统计强化学习:现代机器学习方法,206页pdf
专知会员服务
78+阅读 · 2021年2月24日
【经典书】精通Linux,394页pdf
专知会员服务
92+阅读 · 2021年2月19日
【干货书】面向机器学习的自然语言标注,341页pdf
专知会员服务
67+阅读 · 2021年2月7日
【经典书】操作系统导论,687页pdf
专知会员服务
171+阅读 · 2020年10月28日
【经典书】Python金融大数据分析,566页pdf
专知会员服务
122+阅读 · 2020年8月1日
机器学习速查手册,135页pdf
专知会员服务
340+阅读 · 2020年3月15日
相关资讯
关于机器学习你要了解的 5 件事
机器学习算法与Python学习
7+阅读 · 2018年9月7日
最适合机器学习新手的10种算法
论智
9+阅读 · 2018年1月23日
Python & 机器学习之项目实践 | 赠书
人工智能头条
14+阅读 · 2017年12月26日
机器学习翻译基本原理
论智
5+阅读 · 2017年12月21日
机器学习必备手册
机器学习研究会
19+阅读 · 2017年10月24日
微信扫码咨询专知VIP会员