深度神经网络对分类任务的预测准确度有显著的贡献。然而,他们倾向于在现实世界中做出过度自信的预测,其中存在领域转移和分布外(OOD)的例子。由于计算机视觉提供了对不确定性质量的视觉验证,目前对不确定性估计的研究主要集中在计算机视觉上。然而,在自然语言过程领域却鲜有研究。与贝叶斯方法通过权重不确定性间接推断不确定性不同,当前基于证据不确定性的方法通过主观意见明确地建模类别概率的不确定性。他们进一步考虑了不同根源的数据的固有不确定性,即vacuity(即由于缺乏证据而产生的不确定性)和不协调(即由于相互冲突的证据而产生的不确定性)。本文首次将证据不确定性运用于文本分类任务中的OOD检测。我们提出了一种既采用辅助离群样本,又采用伪离流形样本的廉价框架来训练具有特定类别先验知识的模型,该模型对OOD样本具有较高的空度。大量的经验实验表明,我们基于证据不确定性的模型在OOD实例检测方面优于其他同类模型。我们的方法可以很容易地部署到传统的循环神经网络和微调预训练的transformers。

https://www.zhuanzhi.ai/paper/f1ead8805294e050cc18d08d3f221296

成为VIP会员查看完整内容
25

相关内容

文本分类(Text Classification)任务是根据给定文档的内容或主题,自动分配预先定义的类别标签。
专知会员服务
36+阅读 · 2021年8月17日
专知会员服务
16+阅读 · 2021年8月13日
专知会员服务
17+阅读 · 2021年7月27日
专知会员服务
90+阅读 · 2021年7月9日
专知会员服务
32+阅读 · 2021年7月2日
专知会员服务
13+阅读 · 2021年5月29日
【CVPR2021】多实例主动学习目标检测
专知会员服务
43+阅读 · 2021年4月18日
【ICML2021】因果匹配领域泛化
专知
12+阅读 · 2021年8月12日
您可以相信模型的不确定性吗?
TensorFlow
14+阅读 · 2020年1月31日
检测与识别人与目标之间的互动
极市平台
5+阅读 · 2018年10月12日
用模型不确定性理解模型
论智
11+阅读 · 2018年9月5日
基于样本选择的安全图半监督学习方法
Arxiv
0+阅读 · 2021年9月17日
Arxiv
8+阅读 · 2020年10月7日
Optimization for deep learning: theory and algorithms
Arxiv
105+阅读 · 2019年12月19日
VIP会员
相关VIP内容
专知会员服务
36+阅读 · 2021年8月17日
专知会员服务
16+阅读 · 2021年8月13日
专知会员服务
17+阅读 · 2021年7月27日
专知会员服务
90+阅读 · 2021年7月9日
专知会员服务
32+阅读 · 2021年7月2日
专知会员服务
13+阅读 · 2021年5月29日
【CVPR2021】多实例主动学习目标检测
专知会员服务
43+阅读 · 2021年4月18日
相关资讯
【ICML2021】因果匹配领域泛化
专知
12+阅读 · 2021年8月12日
您可以相信模型的不确定性吗?
TensorFlow
14+阅读 · 2020年1月31日
检测与识别人与目标之间的互动
极市平台
5+阅读 · 2018年10月12日
用模型不确定性理解模型
论智
11+阅读 · 2018年9月5日
基于样本选择的安全图半监督学习方法
微信扫码咨询专知VIP会员