导语:与可见光图像具有不同的成像机理,SAR图像具有较强的相干斑噪声,采用深度卷积神经网络进行SAR图像目标识别时,进行模型优化设计是提高SAR图像目标识别精度的关键因素。
本文针对SAR图像相干斑噪声的影响,提出了使用较大的卷积核来提取目标的有效特征用于分类,并基于分析结果设计了一种用于SAR目标识别的深度卷积神经网络结构。实验结果表明,对于10类目标的分类结果优于或接近目前文献已报道的最优结果。论文的研究成果对具有较强的相干斑噪声的SAR目标识别有一定的实际意义。
基于2维随机卷积特征和具有单个隐层的神经网络模型—超限学习机分析了卷积核宽度对SAR目标分类性能的影响,并设计了一种适用于SAR目标识别的深度卷积神经网络结构。
用于SAR图像识别的深度卷积神经网络
模型结构
模型参数选择原因:
模型中采用了全连接层conv8,通道数设定为96,由于SAR图像的目标类别数较少(≤10),同时前面的卷积层已经提取了目标的有效特征,故采用了较少的通道数。
由于Dropout是提高深度模型泛化能力的有效手段之一,故在卷积层conv8和输出层output间加入Dropout操作防止过拟合情况,Dropout Rate设定为0.1。
虽然BN (Batch Normalization)也是一种提高模型泛化能力的手段,但是考虑到SAR图像的相干斑噪声影响,故在模型中没有使用BN层。用于模型参数训练的损失函数设置为softmaxloss函数。
首先基于二维随机卷积特征和具有单个隐层的神经网络模型-超限学习机分析了卷积核宽度对SAR图像目标分类性能的影响;然后,基于上述分析结果,在实现空间特征提取的卷积层中采用多个具有不同宽度的卷积核提取目标的多尺度局部特征,设计了一种适用于SAR图像目标识别的深度模型结构;最后,在对MSTAR(moving and stationary target acquisition and recognition)数据集中的训练样本进行样本扩充基础上,设定了深度模型训练的超参数,进行了深度模型参数训练与分类性能验证。
conv5层的卷积核参数▲
10类目标的分类混淆矩阵
(无变形目标情况)
10类目标的分类混淆矩阵
(有变形目标情况)
实验结果表明,对于具有较强相干斑噪声的SAR图像而言,采用宽度更大的卷积核能够提取目标的局部特征,提出的模型因能从输入图像提取目标的多尺度局部特征,对于10类目标的分类结果(包含非变形目标和变形目标两种情况)接近或优于已知文献的最优分类结果,目标总体分类精度分别达到了98.39%和97.69%,验证了提出模型结构的有效性。
对于SAR图像目标识别,由于与可见光图像具有不同的成像机理,应采用更大的卷积核来提取目标的空间特征用于分类,通过对深度模型进行优化设计能够提高SAR图像目标识别的精度。
作者简介
实验室简介
引用格式:
Gu Y, Xu Y. Architecture design of deep convolutional neural network for SAR target recognition[J]. Journal of Image and Graphics, 2018, 23(6): 928-936. [谷雨, 徐英. 面向SAR目标识别的深度卷积神经网络结构设计[J]. 中国图象图形学报, 2018, 23(6): 928-936.
DOI:10.11834/jig.170473
原文链接:
投稿,分享
如果你和我们一样关注深度学习,
您在跟踪哪些热点前沿和应用?
有哪些思考想跟大家分享?
可否介绍一下您的研究领域?
可有近期佳作与群友交流?
那就快投稿吧,关注“中国图象图形学报”订阅号,后台直接留言,或发至邮箱hanxd@radi.ac.cn,我们在这里翘首以盼!
前沿丨观点丨咨讯丨独家
扫描下方二维码 关注学报公众号
中国图象图形学报 | 订阅号