点击上方“CVer”,选择加"星标"置顶
重磅干货,第一时间送达
本文转载自:网络人工智能园地
作者:欧奕旻、左育莘、杨锐
赛事回顾
选手分享
1
赛题描述
2
模型介绍
本次比赛我们以Cascade RCNN作为baseline,以Res2Net101作为Backbone;通过逐步融合如soft-NMS、可变卷积(DCN)、多尺度训练(SNIP)等提升检测效果的方法,组成了最终的模型。
1. Baseline的选取
网络结构图 图源|CascadeRCNN[1]
2. Backbone的选取
Res2Net残差结构 图源|Res2Net[2]
3
提升技巧
比赛过程中,我们通过不断增加提升技巧的方式验证各种技巧的适用性。先以CascadeRCNN+ResNet101作为baseline,在公开测试集A上的mAP=64.68%,增加所有提升技巧之后在公开测试集A上的mAP=67.09%。
1. Albu数据增强
2. SNIP多尺度训练和多尺度测试
3. DCN
4. soft-NMS
5.HTC模型预训练
4
总结展望
非常感谢主办方提供的参赛机会,李秀教授的悉心指导,以及华为NAIE网络人工智能云服务提供的AI模型训练平台。本次比赛不仅提高了我们对目标检测算法的掌握程度,还增加了我们海洋船舶方面的知识。但是,我们的模型仍然存在较大的进步空间,比如在使用Albu数据增强时,也应该做一个对比实验进行验证。最后,希望智慧海洋技术快速发展,助力我国海洋强国的建设!
参考文献
[1] Cai Z, Vasconcelos N. Cascade R-CNN: delving into high quality object detection[C]//Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition, 2018: 6154-6162.
[2] Gao S , Cheng M M , Zhao K , et al. Res2Net: A New Multi-scale Backbone Architecture[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2019, PP(99):1-1.
[3] Buslaev A, Iglovikov V I, Khvedchenya E, et al. Albumentations: fast and flexible image augmentations[J]. Information, 2020, 11(2): 125.
[4] Singh B, Davis L S. An analysis of scale invariance in object detection snip[C]//Proceedings of the IEEE conference on computer vision and pattern recognition. 2018: 3578-3587.
[5] Dai J , Qi H , Xiong Y , et al. Deformable Convolutional Networks[J]. 2017.
[6] Bodla N, Singh B, Chellappa R, et al. Improving object detection with one line of code. CoRR (2017)[J]. arXiv preprint arXiv:1704.04503.
CV资源下载
后台回复:CVPR2020,即可下载代码开源的论文合集
后台回复:ECCV2020,即可下载代码开源的论文合集
后台回复:YOLO,即可下载YOLOv4论文和代码
后台回复:Trasnformer综述,即可下载两个最新的视觉Transformer综述PDF,肝起来!
重磅!CVer-目标检测交流群成立
扫码添加CVer助手,可申请加入CVer-目标检测方向 微信交流群,也可申请加入CVer大群,细分方向已涵盖:目标检测、图像分割、目标跟踪、人脸检测&识别、OCR、姿态估计、超分辨率、SLAM、医疗影像、Re-ID、GAN、NAS、深度估计、自动驾驶、强化学习、车道线检测、模型剪枝&压缩、去噪、去雾、去雨、风格迁移、遥感图像、行为识别、视频理解、图像融合、图像检索、论文投稿&交流、Transformer、PyTorch和TensorFlow等群。
一定要备注:研究方向+地点+学校/公司+昵称(如目标检测+上海+上交+卡卡),根据格式备注,才能通过且邀请进群
▲长按加微信群
▲长按关注CVer公众号
整理不易,请给CVer点赞和在看!