数据驱动的实验分析已成为自然语言处理(NLP)算法的主要评价工具。事实上,在过去的十年中,已经很少看到一篇NLP论文,尤其是一篇提出新算法的论文,不包括大量的实验分析,涉及的任务、数据集、领域和语言的数量在不断增加。这种对实证结果的强调强调了统计显著性检验在自然语言处理研究中的作用:如果我们作为一个社区,依赖实证评估来验证我们的假设并揭示正确的语言处理机制,我们最好确保我们的结果不是巧合。

本书的目标是讨论NLP中统计显著性检验的主要方面。我们贯穿全书的指导假设是,NLP研究人员和工程师要处理的基本问题是,一种算法是否可以被认为比另一种算法更好。这个问题推动了这个领域的发展,因为它允许不断发展更好的技术来应对语言处理的挑战。在实践中,研究人员和工程师希望从一组有限的实验中得出正确的结论,这一结论应该适用于其他使用他们没有可用数据集的实验,或由于时间和资源有限而无法执行的实验。因此,本书从两种算法的实验比较的角度讨论了在自然语言处理中使用统计显著性检验的机遇和挑战。我们涵盖的主题包括为主要的NLP任务选择合适的显著性检验,处理非凸深度神经网络显著性检验的独特方面,以统计有效的方式在两种NLP算法之间进行大量的比较(多重假设检验),最后,数据和现场实践的性质带来了独特的挑战。

https://www.morganclaypool.com/doi/10.2200/S00994ED1V01Y202002HLT045

成为VIP会员查看完整内容
46

相关内容

【实用书】文本分析:非结构信息分析,259页pdf
专知会员服务
102+阅读 · 2022年7月5日
《Julia数据科学》及代码,166页pdf
专知会员服务
46+阅读 · 2021年11月4日
最新《非凸优化理论》进展书册,79页pdf
专知会员服务
108+阅读 · 2020年12月18日
【经典书】计算语言学:模型、资源的应用程序,198页pdf
专知会员服务
31+阅读 · 2020年11月19日
专知会员服务
54+阅读 · 2020年7月4日
【清华大学】低资源语言:回顾综述和未来的挑战,14页pdf
【实用书】强化学习实战:Python,110页pdf
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
2+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
1+阅读 · 2009年12月31日
国家自然科学基金
1+阅读 · 2009年12月31日
Arxiv
0+阅读 · 2022年7月19日
Arxiv
17+阅读 · 2020年11月15日
Deep learning for cardiac image segmentation: A review
Arxiv
21+阅读 · 2019年11月9日
Arxiv
12+阅读 · 2019年3月14日
Arxiv
22+阅读 · 2018年8月30日
A Survey on Deep Transfer Learning
Arxiv
11+阅读 · 2018年8月6日
Arxiv
11+阅读 · 2018年5月13日
VIP会员
相关VIP内容
【实用书】文本分析:非结构信息分析,259页pdf
专知会员服务
102+阅读 · 2022年7月5日
《Julia数据科学》及代码,166页pdf
专知会员服务
46+阅读 · 2021年11月4日
最新《非凸优化理论》进展书册,79页pdf
专知会员服务
108+阅读 · 2020年12月18日
【经典书】计算语言学:模型、资源的应用程序,198页pdf
专知会员服务
31+阅读 · 2020年11月19日
专知会员服务
54+阅读 · 2020年7月4日
【清华大学】低资源语言:回顾综述和未来的挑战,14页pdf
相关基金
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
2+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
1+阅读 · 2009年12月31日
国家自然科学基金
1+阅读 · 2009年12月31日
相关论文
Arxiv
0+阅读 · 2022年7月19日
Arxiv
17+阅读 · 2020年11月15日
Deep learning for cardiac image segmentation: A review
Arxiv
21+阅读 · 2019年11月9日
Arxiv
12+阅读 · 2019年3月14日
Arxiv
22+阅读 · 2018年8月30日
A Survey on Deep Transfer Learning
Arxiv
11+阅读 · 2018年8月6日
Arxiv
11+阅读 · 2018年5月13日
微信扫码咨询专知VIP会员