【最佳论文】自动化所提出枪支图片检索新方法

2018 年 8 月 30 日 中国科学院自动化研究所
CASIA
点击蓝字关注我们↑↑↑↑

今日聚焦

自动化所智能感知与计算研究中心的郝杰东,董晶,王伟和谭铁牛团队对枪支图像精细检索问题进行了研究,建立了大规模强制图像数据库的基础上,提出了基于双阈值对比损失函数(double margin contrastive loss)的方法来调整模型,有效提升了检索性能。

在社交网络上,经常会出现一些令用户不适的枪支图片,这些枪支图片需要适当的监管与控制,同时,在取证领域,取证人员需要鉴定枪支品牌及型号的时候,如果不熟悉枪支,将无法快速确定枪支类型,增加工作开展的难度。图像检索技术为解决该类问题提供了新思路。


自动化所智能感知与计算研究中心的郝杰东,董晶,王伟和谭铁牛团队对枪支图像精细检索问题进行了研究,建立了大规模强制图像数据库的基础上,提出了基于双阈值对比损失函数(double margin contrastive loss)的方法来调整模型,有效提升了检索性能。




目前,关于枪支检索的研究工作很少,相关的数据库缺乏。该团队从网络上收集了一个大规模的枪支图像数据库 Firearm14k,该数据由人工标注,包含 167 类共 14755 张图片,可以用于图像精细分类与检索等任务。

数据库地址为:

http://forensics.idealtest.org/Firearm14k/


接着,该团队解决了现有基于 Siamese 架构的方法和基于预训练模型的检索方法不适用于枪支图片及相似度高的图片集上面的缺陷,提出了两步训练的策略。具体来说,首先在 Firearm14k 上利用分类任务来微调原始的模型,然后在此基础上,使用检索任务(基于双阈值对比损失函数)来微调第一步得到的模型。这种策略非常有效,进一步提升了模型的检索性能。


注:基于双阈值对比损失函数(double margin contrastive loss)的方法,在该方法中,相似与不相似图像对的阈值是分别设定的,在模型训练过程中,正负样本对贡献的损失能够更加平衡,保证训练后的模型能够得到较好的检索结果(训练及测试网络架构见图 1)。


图1


最后,团队将该方法与当前主流检索方法进行了对比,无论是在衡量检索方法综合性能的mAP指标上,还是在衡量返回的top-k结果质量的Rank-k准确率指标上,该方法在不同特征维度下的结果都超过了当前主流方法。该方法对一些查询图像返回的top-4结果如图 2 所示。


图2


该研究发表在近日在北京举办的国际模式识别大会上,并获得了"语音,图像,视频与多媒体"track 的 Best Scientific Paper Award。


论文链接:

https://arxiv.org/pdf/1806.02984.pdf

(或点击"阅读原文"下载)


自本期起,紫冬君特开辟AI小白进阶专栏---AI爱新词,欢迎后台留言推荐与"人工智能"相关的新词,凡入选的推荐词,推荐者可署名上榜,外加紫冬君邀请专人释义!


Mathematical Optimization- 在数学、计算机科学以及运筹学的研究中,数学上的优化或者说是规划都统称为优化过程。其效果是运用某些规则从候选值中挑选出最佳取值。在科学研究中,优化是一种常见的技术,几乎像加减法一样在各个领域都有用到,那么你所在的领域里,大家最喜欢用的优化方法是什么呢?

AI爱新词

更多精彩内容,欢迎关注

中科院自动化所官方网站:

http://www.ia.ac.cn

欢迎后台留言、推荐您感兴趣的话题、内容或资讯,小编恭候您的意见和建议!如需转载或投稿,请后台私信。

编辑:鲁宁、欧梨成

解锁更多智能之美

中科院自动化研究所

微信:casia1956

欢迎搭乘自动化所AI旗舰号!

点击"阅读原文"下载全文

登录查看更多
0

相关内容

董晶,博士毕业于中科院自动化研究所模式识别国家重点实验室,现任中国科学院自动化研究所智能感知与计算研究中心副研究员。主要从事图像处理、计算机视觉、多媒体内容安全方面的研究工作,已在国际权威期刊及学术会议上发表学术论文60余篇,已授权国家发明专利14项,其中3项美国专利。主持或主要参与了国家重点研发计划课题及国家自然科学基金等20余项国家和省部级科研项目。现为中国科学院青年创新促进会会员;中国人工智能(CAAI)学会理事、杰出会员;中国图象图形学学会(CSIG)理事、副秘书长;CSIG女科技工作者委员会秘书长,CSIG数字媒体取证与安全专委会常委、副秘书长、CSIG视觉大数据专委会委员、中国计算机学会(CCF)计算机视觉专业委员会委员,北京图象图形学学会常务理事,青工委主任;亚太信号与信息处理协会(APSIPA)多媒体安全取证专委会委员、美国电气电子工程师学会(IEEE) 高级会员、IEEE亚太区执委、IEEE亚太区人道主义科技活动委员会主席(2019-2022)、IEEE亚太区女工程师委员会主席(2017-2018)、IAPR 《Newsletter》主编, Elsevier 《Journal of Information Security and Application》国际期刊的副主编,曾获2016年度IBM教职人员奖、2018年度国际模式识别大会最佳科技论文奖、2019年度中国人工智能学会杰出贡献会员奖、2020年度CSIG石青云女科学家奖(青年组)。多次担任IEEE TIFS, TIP, IJCAI,ICCV, ECCV, CVPR,ICIP,ICPR等本领域权威的国内外相关学术会议的论文评审与会议组织工作。
基于视觉的三维重建关键技术研究综述
专知会员服务
160+阅读 · 2020年5月1日
姿势服装随心换-CVPR2019
专知会员服务
34+阅读 · 2020年1月26日
【综述】关键词生成,附10页pdf论文下载
专知会员服务
52+阅读 · 2019年11月20日
【CCL 2019】刘康、韩先培:做失败科研的10个方法
专知会员服务
27+阅读 · 2019年11月12日
科研人员提出海量虚拟数据生成新方法
中科院之声
6+阅读 · 2019年9月25日
人脸识别研究取得进展
中科院之声
4+阅读 · 2019年3月26日
【紫冬新作】人脸识别新突破:真实场景下的大规模双样本学习方法
中国科学院自动化研究所
11+阅读 · 2019年3月7日
基于对偶学习的跨领域图片描述生成
PaperWeekly
6+阅读 · 2017年11月7日
基于图片内容的深度学习图片检索(一)
七月在线实验室
20+阅读 · 2017年10月1日
A survey on deep hashing for image retrieval
Arxiv
14+阅读 · 2020年6月10日
Knowledge Distillation from Internal Representations
Arxiv
4+阅读 · 2019年10月8日
Arxiv
5+阅读 · 2018年3月6日
VIP会员
相关资讯
科研人员提出海量虚拟数据生成新方法
中科院之声
6+阅读 · 2019年9月25日
人脸识别研究取得进展
中科院之声
4+阅读 · 2019年3月26日
【紫冬新作】人脸识别新突破:真实场景下的大规模双样本学习方法
中国科学院自动化研究所
11+阅读 · 2019年3月7日
基于对偶学习的跨领域图片描述生成
PaperWeekly
6+阅读 · 2017年11月7日
基于图片内容的深度学习图片检索(一)
七月在线实验室
20+阅读 · 2017年10月1日
Top
微信扫码咨询专知VIP会员