培训前语文模拟积极学习以进行判决比对 (Pre-trained Language Model Based Active Learning for Sentence Matching)

Active learning is able to significantly reduce the annotation cost for data-driven techniques. However, previous active learning approaches for natural language processing mainly depend on the entropy-based uncertainty criterion, and ignore the characteristics of natural language. In this paper, we propose a pre-trained language model based active learning approach for sentence matching. Differing from previous active learning, it can provide linguistic criteria to measure instances and help select more efficient instances for annotation. Experiments demonstrate our approach can achieve greater accuracy with fewer labeled training instances.

翻译：积极学习可以大幅降低数据驱动技术的注释成本,然而,以往对自然语言处理的积极学习方法主要取决于基于酶基的不确定性标准,而忽略了自然语言的特性。在本文件中,我们提出了一种以培训前语言模式为基础的积极学习方法,用于匹配句子。与以往积极学习不同,它可以提供语言标准,以衡量实例,帮助选择更有效的注释实例。实验表明,我们的方法可以以较少的标签培训实例实现更高的准确性。

相关内容

主动学习

关注 241

主动学习是机器学习（更普遍的说是人工智能）的一个子领域，在统计学领域也叫查询学习、最优实验设计。“学习模块”和“选择策略”是主动学习算法的2个基本且重要的模块。主动学习是“一种学习方法，在这种方法中，学生会主动或体验性地参与学习过程，并且根据学生的参与程度，有不同程度的主动学习。” （Bonwell＆Eison 1991）Bonwell＆Eison（1991）指出：“学生除了被动地听课以外，还从事其他活动。” 在高等教育研究协会（ASHE）的一份报告中，作者讨论了各种促进主动学习的方法。他们引用了一些文献，这些文献表明学生不仅要做听，还必须做更多的事情才能学习。他们必须阅读，写作，讨论并参与解决问题。此过程涉及三个学习领域，即知识，技能和态度（KSA）。这种学习行为分类法可以被认为是“学习过程的目标”。特别是，学生必须从事诸如分析，综合和评估之类的高级思维任务。

【ICML2020】深度神经网络置信感知学习，Conﬁdence-Aware Learning for Deep Neural Networks

专知会员服务

74+阅读 · 2020年7月6日

深度神经网络中的快捷学习，Shortcut Learning in Deep Neural Networks

专知会员服务

22+阅读 · 2020年4月21日