自然语言处理(NLP)在神经模型的基础上,在过去的十年中取得了很大的进展,经常利用大量的标记数据来实现最先进的性能。对标记数据的依赖使NLP模型无法应用于资源不足的设置和语言,因为标记大量文本数据通常需要时间、金钱和专业知识。因此,在有限的标记数据下学习的能力对于将神经系统部署到真实的NLP应用是至关重要的。近年来,人们已经探索了许多方法来缓解自然语言处理中对标记数据的需求,如数据增强和半监督学习。本教程旨在提供这些方法的系统和最新的概述,以帮助研究人员和从业人员理解从有限的标记数据中学习的方法和挑战,这是计算语言学社区的一个新兴话题。我们将考虑应用于各种各样的NLP任务(包括文本分类、生成和结构化预测),并将突出当前的挑战和未来的方向。

成为VIP会员查看完整内容
28

相关内容

专知会员服务
76+阅读 · 2021年7月23日
赛尔笔记 | 自然语言处理中的迁移学习(上)
哈工大SCIR
16+阅读 · 2019年10月17日
300页文本知识提取与推断最新教程
机器学习算法与Python学习
13+阅读 · 2018年8月28日
国家自然科学基金
12+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
4+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
2+阅读 · 2011年12月31日
国家自然科学基金
1+阅读 · 2008年12月31日
Arxiv
14+阅读 · 2022年5月6日
Arxiv
22+阅读 · 2018年8月30日
VIP会员
相关VIP内容
专知会员服务
76+阅读 · 2021年7月23日
相关基金
国家自然科学基金
12+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
4+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
2+阅读 · 2011年12月31日
国家自然科学基金
1+阅读 · 2008年12月31日
微信扫码咨询专知VIP会员