大连理工大学在CVPR18大规模精细粒度物种识别竞赛中获得冠军

2018 年 7 月 20 日 量子位

大连理工大学此前在CVPR2018的iNaturalist竞赛中，取得了第一名（1/59）。这个比赛由Google、加州理工和康奈尔大学组织，微软公司赞助，旨在解决大规模的精细粒度物种分类问题。

在这篇投稿中，大连理工大学的学者，介绍了他们在这次比赛中的相关技术方案，希望给相关研究者带来一些启发。

近日，引人瞩目的国际计算机视觉与模式识别大会CVPR 2018在美国盐湖城落下帷幕。在为期5天的会议中，除了有精彩的口头报告、墙报张贴以及企业展示之外，还有对极具挑战性的竞赛的宣讲和总结。

在大会开幕式的特别环节中，四个具有代表性的竞赛组委会被邀请上台进行宣讲。其中精细粒度分类workshop FGVC5的旗舰挑战赛iNaturalist Challenge 2018 (iNat-2018)是该环节的重头戏之一，该竞赛由谷歌公司、加州理工和康奈尔大学共同组织，并得到微软公司赞助。

在iNat-2018竞赛中，大连理工大学信息与通信工程学院李培华教授所指导的团队DLUT_VLG取得第1名(1/59)，在识别率上分别高出第2名Deep Learning Analytics公司和第3名Baidu VIS团队1.1%和1.8%。

尽管基于深度学习的视觉识别取得了很大进展，大规模物种识别问题仍然是一个巨大的挑战。在微软公司启动的智慧地球项目中，为了有效地保护生物多样性，关键任务之一是能够从数字图像中自动识别自然界中种类繁多的动物、植物和菌类等。

谷歌公司也与加州理工和康奈尔大学合作，提出视觉维基百科项目，致力于精细粒度种类识别问题。正是在这样的背景下，谷歌公司和微软公司联合推出了iNat-2018，旨在解决基于视觉的大规模物种识别这一难题。

相对于粗粒度、仅包含1000类、类别样本均衡的ImageNet竞赛，iNat-2018具有显著不同：

(1) 属于精细粒度分类问题─类别之间差异细微；

(2) 类别数规模更大─类别数是ImageNet竞赛的8倍多，超过8000类物种；

(3) 不同类别样本分布极不均衡，呈现长尾分布─每类最多有1000张样本图像、最少却仅有2张样本图像；

上述这些因素使iNat-2018竞赛更具有挑战性。

本次竞赛冠军DLUT_VLG所使用核心技术方案，是基于该团队所研发的矩阵幂正规化协方差聚合（MPN-COV）卷积网络网络模型及快速训练算法。

MPN-COV模型的新颖之处在于在网络中引入了二阶统计信息作为图像表征，与经典方法在学习过程中仅仅挖掘一阶统计信息具有显著不同，能够学习到分辨能力更强的视觉特征。

通过引入全局协方差聚合和矩阵幂正规化技术，MPN-COV模型在性能上显著优于经典的卷积网络，而且收敛速度更快，相关工作发表在ICCV 2017和CVPR 2018上。

除了全局协方差聚合之外，该课题组也深入研究了全局高斯聚合卷积网络，解决了高斯流形嵌入和端到端学习问题，研究成果发表于CVPR 2017 (oral)和TPAMI 2017。

传送门

iNaturalist竞赛

https://www.kaggle.com/c/inaturalist-2018

李培华教授的主页：

http://peihuali.org/

MPN-COV相关工作：

Towards Faster Training of Global Covariance Pooling Networks by Iterative Matrix Square Root Normalization

Peihua Li, Jiangtao Xie, Qilong Wang, Zilin Gao

http://openaccess.thecvf.com/content_cvpr_2018/papers/Li_Towards_Faster_Training_CVPR_2018_paper.pdf

Is Second-order Information Helpful for Large-scale Visual Recognition?

Peihua Li, Jiangtao Xie, Qilong Wang, Wangmeng Zuo

http://openaccess.thecvf.com/content_ICCV_2017/papers/Li_Is_Second-Order_Information_ICCV_2017_paper.pdf

— 完 —

活动报名

诚挚招聘

量子位正在招募编辑/记者，工作地点在北京中关村。期待有才气、有热情的同学加入我们！相关细节，请在量子位公众号(QbitAI)对话界面，回复“招聘”两个字。

量子位 QbitAI · 头条号签约作者

վ'ᴗ' ի 追踪AI技术和产品新动态

登录查看更多

知识荟萃

精品入门和进阶教程、论文和代码整理等

查看相关VIP内容、论文、资讯等

【CVPR2020-北京大学】自适应间隔损失的提升小样本学习

专知会员服务

85+阅读 · 2020年6月9日

【CVPR 2020-商汤】8比特数值也能训练卷积神经网络模型

专知会员服务

26+阅读 · 2020年5月7日

【CVPR2020 旷视研究院】探索类别正则化的领域自适应对象检测

专知会员服务

24+阅读 · 2020年4月22日

【CVPR2020-港科大-腾讯】基于注意力机制及多关系检测器的小样本物体检测

专知会员服务

39+阅读 · 2020年4月6日

【CVPR2020-百度】用于视觉识别的门控信道变换

专知会员服务

13+阅读 · 2020年3月30日

【CVPR2020-中科院-腾讯优图】基于注意力卷积二叉神经树的细粒度视觉分类

专知会员服务

26+阅读 · 2020年3月29日

【华南理工大学-CVPR2020-Oral】通过结构正则化深度聚类实现无监督域自适应

专知会员服务

56+阅读 · 2020年3月20日

【CVPR2020-加州理工大学Devi Parikh】多任务视觉和语言表示学习

专知会员服务

38+阅读 · 2020年2月25日

AAAI 2020最佳论文公布，华盛顿大学、AllenAI、NTU、清华、港大等斩获

专知会员服务

51+阅读 · 2020年2月8日

浅谈文字识别：新思考、新挑战及新机遇，华南理工大学金连文教授，VALSE2019: 让机器像人一样阅读：文字检测与识别新趋势

专知会员服务

26+阅读 · 2019年10月24日

【CVPR2019竞赛】低光照人脸检测竞赛冠军代码与PPT分享

专知

54+阅读 · 2019年6月20日

商汤科技62篇论文入选CVPR 2019，多个竞赛项目夺冠

商汤科技

4+阅读 · 2019年6月19日

竞赛推荐 | ChinaMM2019 竞赛-1：水下图像增强

极市平台

13+阅读 · 2019年5月7日

竞赛 | CVPR 2019 十大细粒度视觉识别挑战赛来袭，谷歌发来参赛征集令！

AI科技评论

7+阅读 · 2019年5月1日

竞赛 | Kaggle上有哪些有趣又多金的计算机视觉类比赛？

计算机视觉life

8+阅读 · 2018年11月28日

【CVPR智慧城市挑战赛】无监督交通异常检测，冠军团队技术分享

新智元

5+阅读 · 2018年7月5日

报名 | 码隆科技与谷歌研究院合办Kaggle大赛，挑战商品图像分类极限！

机器之心

10+阅读 · 2018年4月19日

谷歌开启 Naturalist 2018 挑战赛，大型物种分类技术有望突破

AI研习社

5+阅读 · 2018年3月11日

【消息】自动化所获计算机视觉大会ICCV2017场景解析竞赛冠军

中国科学院自动化研究所

5+阅读 · 2017年11月6日

【重磅】最后一届ImageNet榜单出炉：颜水成等中国团队夺多项冠军

新智元

3+阅读 · 2017年7月18日

Learning Disentangled Representations for Recommendation

Arxiv

8+阅读 · 2019年10月31日

Scene Text Detection and Recognition: The Deep Learning Era

Arxiv

27+阅读 · 2019年9月5日

Active Generative Adversarial Network for Image Classification

Arxiv

4+阅读 · 2019年6月17日

Local Relation Networks for Image Recognition

Arxiv

4+阅读 · 2019年4月25日

A Comprehensive Comparison of Unsupervised Network Representation Learning Methods

Arxiv

5+阅读 · 2019年3月19日

Panoptic Segmentation with a Joint Semantic and Instance Segmentation Network

Arxiv

5+阅读 · 2018年9月6日

Deep Convolutional Networks as shallow Gaussian Processes

Arxiv

4+阅读 · 2018年8月16日

Zero-Shot Object Detection

Arxiv

9+阅读 · 2018年7月27日

On the iterative refinement of densely connected representation levels for semantic segmentation

Arxiv

6+阅读 · 2018年4月30日

ArcFace: Additive Angular Margin Loss for Deep Face Recognition

Arxiv

6+阅读 · 2018年1月23日

VIP会员

大连理工大学在CVPR18大规模精细粒度物种识别竞赛中获得冠军

相关内容

知识荟萃

更多