该文被大会录用为Oral论文,是北京邮电大学与英国萨里大学“北邮-萨里人工智能联合实验室”的联合研究成果,指导老师是来自人工智能与网络搜索教研中心的郭军教授、马占宇教授和萨里大学CVSSP中心SketchX Lab的Yi-Zhe Song教授。人工智能学院博士生常东良同学为论文一作。本文首先通过一个Human Study 发现了传统细粒度图像分类任务无法满足大多人需求的问题,进而重新定义了该任务:从单标签分类任务拓展为按照预先定义的层次化标签(从粗粒度到细粒度)进行自上而下的多标签分类任务。此外,通过实验发现粗粒度标签预测任务会抑制细粒度特征的学习,而细粒度标签预测任务则会促进粗粒度特征的学习。该发现促使我们设计了一个简单且高效的解决方案来解决本文提出的新任务:(1)利用与粒度相关的分类器将粗粒度特征与细粒度特征进行解耦;(2)通过一个梯度控制器使得细粒度特征能够参与粗粒度分类器的决策。实验表明,本文提出的方法在新的细粒度图像分类任务中获得了最佳的性能。
https://www.zhuanzhi.ai/paper/f08dadad7419f6bfad654674dfb16336