今日聚焦
自动化所智能感知与计算研究中心的郝杰东,董晶,王伟和谭铁牛团队对枪支图像精细检索问题进行了研究,建立了大规模强制图像数据库的基础上,提出了基于双阈值对比损失函数(double margin contrastive loss)的方法来调整模型,有效提升了检索性能。
在社交网络上,经常会出现一些令用户不适的枪支图片,这些枪支图片需要适当的监管与控制,同时,在取证领域,取证人员需要鉴定枪支品牌及型号的时候,如果不熟悉枪支,将无法快速确定枪支类型,增加工作开展的难度。图像检索技术为解决该类问题提供了新思路。
自动化所智能感知与计算研究中心的郝杰东,董晶,王伟和谭铁牛团队对枪支图像精细检索问题进行了研究,建立了大规模强制图像数据库的基础上,提出了基于双阈值对比损失函数(double margin contrastive loss)的方法来调整模型,有效提升了检索性能。
目前,关于枪支检索的研究工作很少,相关的数据库缺乏。该团队从网络上收集了一个大规模的枪支图像数据库 Firearm14k,该数据由人工标注,包含 167 类共 14755 张图片,可以用于图像精细分类与检索等任务。
数据库地址为:
http://forensics.idealtest.org/Firearm14k/
接着,该团队解决了现有基于 Siamese 架构的方法和基于预训练模型的检索方法不适用于枪支图片及相似度高的图片集上面的缺陷,提出了两步训练的策略。具体来说,首先在 Firearm14k 上利用分类任务来微调原始的模型,然后在此基础上,使用检索任务(基于双阈值对比损失函数)来微调第一步得到的模型。这种策略非常有效,进一步提升了模型的检索性能。
注:基于双阈值对比损失函数(double margin contrastive loss)的方法,在该方法中,相似与不相似图像对的阈值是分别设定的,在模型训练过程中,正负样本对贡献的损失能够更加平衡,保证训练后的模型能够得到较好的检索结果(训练及测试网络架构见图 1)。
图1
最后,团队将该方法与当前主流检索方法进行了对比,无论是在衡量检索方法综合性能的mAP指标上,还是在衡量返回的top-k结果质量的Rank-k准确率指标上,该方法在不同特征维度下的结果都超过了当前主流方法。该方法对一些查询图像返回的top-4结果如图 2 所示。
图2
该研究发表在近日在北京举办的国际模式识别大会上,并获得了"语音,图像,视频与多媒体"track 的 Best Scientific Paper Award。
论文链接:
https://arxiv.org/pdf/1806.02984.pdf
(或点击"阅读原文"下载)
自本期起,紫冬君特开辟AI小白进阶专栏---AI爱新词,欢迎后台留言推荐与"人工智能"相关的新词,凡入选的推荐词,推荐者可署名上榜,外加紫冬君邀请专人释义!
Mathematical Optimization- 在数学、计算机科学以及运筹学的研究中,数学上的优化或者说是规划都统称为优化过程。其效果是运用某些规则从候选值中挑选出最佳取值。在科学研究中,优化是一种常见的技术,几乎像加减法一样在各个领域都有用到,那么你所在的领域里,大家最喜欢用的优化方法是什么呢?
更多精彩内容,欢迎关注
中科院自动化所官方网站:
http://www.ia.ac.cn
欢迎后台留言、推荐您感兴趣的话题、内容或资讯,小编恭候您的意见和建议!如需转载或投稿,请后台私信。
编辑:鲁宁、欧梨成
中科院自动化研究所
微信:casia1956
欢迎搭乘自动化所AI旗舰号!
点击"阅读原文"下载全文