深度学习正变得越来越普遍,由于它的成功,它很可能在未来几年被应用到我们生活的几乎每个方面。然而,它的成功故事掩盖了在现实世界中不慎应用它所带来的危险。事实上,即使深度学习模型在准确性(或任何其他选择的指标)方面报告了惊人的高性能,它们也不能保证模型在实际使用时不会出现任何意外行为。这在安全关键型应用程序中尤其危险,在这种应用程序中,即使一个无法预见的错误也可能造成严重的后果。此外,每走错一步,人类对这项技术的信心就会动摇,从而延缓了它的采用。因此,通过减少(如果不是完全排除)所有意想不到的行为来提高这些模型的可信性是极其重要的。
https://ora.ox.ac.uk/objects/uuid:6a59319b-fe5e-44b8-875c-fa679e578f2e
在这篇论文中,我要解决的问题是,如何构建基于深度学习的模型能够 (I)保证满足给定的一组需求,这些需求陈述了模型的正确行为,(ii)从需求本身指定的背景知识中学习以提高性能。我特别关注(I)多标签分类问题的深度学习模型,以及(ii)作为硬逻辑约束建模的需求。为了实现这一目标,我首先考虑具有层次约束的多标签分类问题,然后逐步增加约束的表达能力。在项目的第一阶段,专注于分层多标签分类问题,这是在A1→A形式的输出空间上有分层约束的多标签分类问题,表示A1是A的子类。针对这类问题,我开发了一个新的模型C-HMCNN(h),对于底层的多标签分类问题,给定网络h,利用层次结构信息来产生预测,保证满足层次结构约束并提高h的性能。在项目的第二阶段,我考虑了用正常逻辑规则表示的约束,即A1,…, Ak, k+1,…, An→a这个表达式强制每当类A1,…, Ak为预测值,而Ak+1,…,则应预测A类。针对这个问题,我开发了CCN(h),它是C-HMCNN(h)的扩展。对于底层的多标签分类问题,该模型给出了一个网络h,它能够(i)产生保证满足约束的预测,并且(ii)利用约束中包含的信息来提高性能。最后,为了说明本文所处理问题的重要性,我创建了带有逻辑需求的ROad事件感知数据集(ROad - r),这是第一个公开的自动驾驶数据集,其需求建模为输出空间上的约束,并表示为命题逻辑公式。通过创建ROADR,我能够表明当前最先进的模型不能仅从数据点了解需求。我的实验结果表明,他们超过90%的预测违反了约束条件,并且有可能利用给定的需求来创建(i)具有更好的性能和(ii)保证符合给定的需求的模型。