数据及代码已开源:https://github.com/bcmi/SimTrans-Weak-Shot-Classification

基础种类有强标注(clean label)的图片,而新种类只有弱标注(noisy label)的图片。弱标注的图片可以使用类别名称在公共网站上检索来获得,这是一个有潜力的数据源来支持新种类的学习而不耗费任何的人工标注。研究如何从基础种类向新种类迁移信息,解决新种类训练图片标签噪音的问题。

我们方法的训练阶段由两部分组成:在基础种类训练集上学习相似度网络;在新种类数据集上学习主分类器。相似度网络的架构如图3所示,它输入一批图片,然后输出每一对图片之间的相似度分数。其中的枚举层把每一对图片的骨干网络特征拼接起来,称之为关系特征。然后通过全连接层对拼接起来的特征输出相似度分数。相似度分数由分类代价函数监督,如果一对图片是来自于同一个种类,那么就是"相似"种类,反之则为"不相似"种类。如果自由地抽取一批图片,那么绝大多数图片对是来自于不同的种类。所以为了减少相似对和不相似对的不均衡问题,对于每一批图片,我们首先选择少量的种类,然后再从少量的种类中抽取图片。

对于单个新种类中网络图片来说,我们可以发现标签正确的样本通常占大多数。当在单个新种类中计算每一对图片的相似度时,我们可以发现标签错误的样本与其他大部分图片都不相似。因此,我们可以根据一张图片是否与其他图片相似来判断它标签的正确与否。对于每一个新种类,我们首先利用预训练好的相似度网络计算该种类中所有图片对的相似度,得到了一个相似度矩阵,然后我们利用某个图片与其他所有图片的相似度的平均作为该图片的代价函数权重。 然后所有图片的权重规范化到均值为1。最后,将图片的权重应用于分类的代价函数中。通过这样的方式,我们对标签错误样本的分类代价函数施加更低的权重。

当直接在新种类训练集上学习的时候,特征图结构,也就是图片特征之间的相似度,被噪声标签所主导。例如,噪声标签的代价函数隐式地拉近具有相同标签的图片的特征距离。然后这样的特征图结构可能被噪声标签所误导,所以我们试图用迁移来的相似度来纠正被误导的特征图结构。具体地,我们使用经典的图正则化来规范特征,使得语义相似的图片对的特征相近。 网络图片主要有两种噪声:异常值和标签翻转。异常值指图片不属于任务中所考虑的任何种类,而标签翻转指图片的真实标签是所考虑种类中的一种。对于标签翻转噪声,上文介绍的样本权重方法直接通过分配更低的权重抛弃了它们。然后图正则化可以利用它们来保持合理的特征图结构和帮助特征学习。方法细节和实验结果请参见论文。

成为VIP会员查看完整内容
20

相关内容

专知会员服务
14+阅读 · 2021年10月18日
专知会员服务
62+阅读 · 2021年7月25日
专知会员服务
28+阅读 · 2021年6月7日
专知会员服务
44+阅读 · 2021年1月31日
专知会员服务
31+阅读 · 2020年9月2日
注意力图神经网络的多标签文本分类
专知会员服务
111+阅读 · 2020年3月28日
论文浅尝 | DeCLUTR: 无监督文本表示的深度对比学习
开放知识图谱
4+阅读 · 2020年10月4日
【小样本·多分类】如何解决「小样本」+「多分类」问题?
深度学习自然语言处理
3+阅读 · 2020年5月5日
单语言表征如何迁移到多语言去?
AI科技评论
5+阅读 · 2019年11月21日
论文浅尝 | 多标签分类中的元学习
开放知识图谱
6+阅读 · 2019年9月25日
ICCV2019|基于全局类别表征的小样本学习
极市平台
11+阅读 · 2019年9月21日
通过时空模型迁移学习的无监督的跨数据集行人重新识别
统计学习与视觉计算组
8+阅读 · 2018年10月23日
CVPR2018:基于时空模型无监督迁移学习的行人重识别
全球人工智能
7+阅读 · 2018年3月26日
Contrastive Representation Distillation
Arxiv
5+阅读 · 2019年10月23日
Two Stream 3D Semantic Scene Completion
Arxiv
4+阅读 · 2018年7月16日
Arxiv
3+阅读 · 2018年4月10日
VIP会员
相关VIP内容
专知会员服务
14+阅读 · 2021年10月18日
专知会员服务
62+阅读 · 2021年7月25日
专知会员服务
28+阅读 · 2021年6月7日
专知会员服务
44+阅读 · 2021年1月31日
专知会员服务
31+阅读 · 2020年9月2日
注意力图神经网络的多标签文本分类
专知会员服务
111+阅读 · 2020年3月28日
相关资讯
论文浅尝 | DeCLUTR: 无监督文本表示的深度对比学习
开放知识图谱
4+阅读 · 2020年10月4日
【小样本·多分类】如何解决「小样本」+「多分类」问题?
深度学习自然语言处理
3+阅读 · 2020年5月5日
单语言表征如何迁移到多语言去?
AI科技评论
5+阅读 · 2019年11月21日
论文浅尝 | 多标签分类中的元学习
开放知识图谱
6+阅读 · 2019年9月25日
ICCV2019|基于全局类别表征的小样本学习
极市平台
11+阅读 · 2019年9月21日
通过时空模型迁移学习的无监督的跨数据集行人重新识别
统计学习与视觉计算组
8+阅读 · 2018年10月23日
CVPR2018:基于时空模型无监督迁移学习的行人重识别
全球人工智能
7+阅读 · 2018年3月26日
微信扫码咨询专知VIP会员