最近的研究表明,可解释性和鲁棒性是可信和可靠文本分类的两个关键因素。然而,以往的研究通常涉及两个方面之一:i)如何在有利于预测的同时提取出可解释性的准确理论;如何使预测模型对不同类型的对抗攻击具有鲁棒性。从直观上看,一个产生有用解释的模型应该在对抗攻击时更加鲁棒,因为我们不能相信输出解释但在小扰动下改变预测的模型。为此,我们提出了一个联合分类和基本原理提取模型AT-BMC。它包括两种关键机制: 混合对抗训练(AT)利用离散空间和嵌入空间中的各种扰动来提高模型的鲁棒性,边界匹配约束(BMC)利用边界信息的引导来更精确地定位理论。在基准数据集上的性能表明,所提出的AT-BMC在分类和基本原理提取方面都大大优于基线。鲁棒性分析表明,所提出的AT-BMC有效地降低了攻击成功率,达到69%。实证结果表明,鲁棒的模型与较好的解释之间存在联系。

成为VIP会员查看完整内容
18

相关内容

文本分类(Text Classification)任务是根据给定文档的内容或主题,自动分配预先定义的类别标签。
【AAAI2022】基于双流更新的视觉Transformer动态加速方法
专知会员服务
23+阅读 · 2021年12月11日
【NeurIPS2021】序一致因果图的多任务学习
专知会员服务
19+阅读 · 2021年11月7日
专知会员服务
15+阅读 · 2021年9月25日
专知会员服务
23+阅读 · 2021年8月27日
专知会员服务
23+阅读 · 2021年7月17日
专知会员服务
24+阅读 · 2021年1月21日
【ICML2020-浙江大学】对抗性互信息的文本生成
专知会员服务
43+阅读 · 2020年7月4日
DeepMind出品,图神经网络与因果推理的联合
图与推荐
4+阅读 · 2021年9月11日
国家自然科学基金
8+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
3+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
4+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
1+阅读 · 2009年12月31日
Arxiv
17+阅读 · 2021年3月29日
Arxiv
25+阅读 · 2017年12月6日
Arxiv
10+阅读 · 2017年7月4日
VIP会员
相关VIP内容
【AAAI2022】基于双流更新的视觉Transformer动态加速方法
专知会员服务
23+阅读 · 2021年12月11日
【NeurIPS2021】序一致因果图的多任务学习
专知会员服务
19+阅读 · 2021年11月7日
专知会员服务
15+阅读 · 2021年9月25日
专知会员服务
23+阅读 · 2021年8月27日
专知会员服务
23+阅读 · 2021年7月17日
专知会员服务
24+阅读 · 2021年1月21日
【ICML2020-浙江大学】对抗性互信息的文本生成
专知会员服务
43+阅读 · 2020年7月4日
相关基金
国家自然科学基金
8+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
3+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
4+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
1+阅读 · 2009年12月31日
微信扫码咨询专知VIP会员