数据增强是通过转换为机器学习人工创建训练数据,是机器学习学科中一个广泛研究的研究领域。虽然它对于提高模型的泛化能力很有用,但它也可以解决许多其他挑战和问题,从克服有限数量的训练数据到规范目标到限制数据量用于保护隐私。基于对数据增强的目标和应用的精确描述以及现有的分类法作品,该调查涉及用于文本分类的数据增强方法,旨在实现简洁和研究人员和从业人员的综合概述。根据分类法,我们将100多种方法分为12不同的分组,并提供最先进的参考资料,阐述哪些方法非常有前途。最后,研究给出了可能构成未来工作基石的观点。

https://www.zhuanzhi.ai/paper/6a3ab7686edb4fbbc9b7fe15b7a349a4

成为VIP会员查看完整内容
66

相关内容

文本分类(Text Classification)任务是根据给定文档的内容或主题,自动分配预先定义的类别标签。
专知会员服务
70+阅读 · 2021年7月21日
专知会员服务
17+阅读 · 2021年4月16日
专知会员服务
122+阅读 · 2020年12月9日
多模态视觉语言表征学习研究综述
专知会员服务
192+阅读 · 2020年12月3日
最新《低资源自然语言处理》综述论文,21页pdf
专知会员服务
60+阅读 · 2020年10月27日
【文本分类大综述:从浅层到深度学习,35页pdf】
专知会员服务
188+阅读 · 2020年8月6日
专知会员服务
100+阅读 · 2020年7月20日
【文献综述】图像分割综述,224篇参考文献,附58页PDF
专知会员服务
121+阅读 · 2019年6月16日
多模态视觉语言表征学习研究综述
专知
27+阅读 · 2020年12月3日
最新《多任务学习》综述,39页pdf
专知
28+阅读 · 2020年7月10日
热点! 虚假新闻检测综述
专知
111+阅读 · 2019年2月26日
深度学习目标检测算法综述
AI研习社
25+阅读 · 2019年2月1日
NLP 研究灵感库
AI研习社
3+阅读 · 2018年6月10日
干货 | NLP 研究灵感库
AI科技评论
7+阅读 · 2018年6月7日
One-Class Classification: A Survey
Arxiv
7+阅读 · 2021年1月8日
An Attentive Survey of Attention Models
Arxiv
44+阅读 · 2020年12月15日
Arxiv
16+阅读 · 2020年5月20日
Arxiv
24+阅读 · 2019年11月24日
Arxiv
151+阅读 · 2017年8月1日
VIP会员
相关VIP内容
专知会员服务
70+阅读 · 2021年7月21日
专知会员服务
17+阅读 · 2021年4月16日
专知会员服务
122+阅读 · 2020年12月9日
多模态视觉语言表征学习研究综述
专知会员服务
192+阅读 · 2020年12月3日
最新《低资源自然语言处理》综述论文,21页pdf
专知会员服务
60+阅读 · 2020年10月27日
【文本分类大综述:从浅层到深度学习,35页pdf】
专知会员服务
188+阅读 · 2020年8月6日
专知会员服务
100+阅读 · 2020年7月20日
【文献综述】图像分割综述,224篇参考文献,附58页PDF
专知会员服务
121+阅读 · 2019年6月16日
相关资讯
多模态视觉语言表征学习研究综述
专知
27+阅读 · 2020年12月3日
最新《多任务学习》综述,39页pdf
专知
28+阅读 · 2020年7月10日
热点! 虚假新闻检测综述
专知
111+阅读 · 2019年2月26日
深度学习目标检测算法综述
AI研习社
25+阅读 · 2019年2月1日
NLP 研究灵感库
AI研习社
3+阅读 · 2018年6月10日
干货 | NLP 研究灵感库
AI科技评论
7+阅读 · 2018年6月7日
相关论文
微信扫码咨询专知VIP会员