【论文】Concurrent Segmentation and Object Detection CNNs for Aircraft Detection and Identification

这篇论文来自preligens,同时采用了分割和检测算法来实现遥感影像飞机的检测和识别,创造性的将分割和检测两类算法进行了融合,提高了检测识别的精度和效率。

一、引言

  • 介绍背景、CNN的发展和作用、分割网络和检测网络的代表性类型;
  • 本文中,作者试图找到一种高效且鲁棒的能够解决飞机检测识别问题的方法。因此,作者提出了一个基于不同CNN模型的混合方法:一个基于U-Net的分割网络,用于更高效的检测(better detection rate);一个基于RetinaNet的检测模型,用于识别并提高精度(identifying and improving the precision)。

二、方法

混合模型各部分选择的前提:(1)改变训练模式会引起模型内部特征提取方式的改变;(2)分割模型非常有效,但是在目标的分割和识别中效果较差;(3)在高分辨率的卫星影像中,飞机的尺寸是有限的。

1. 分割的CNN网络

分割网络实现的目标:(1)检测飞机(无需识别);(2)获得高的recall(尤其是在位置信息上);(3)鲁棒性强。

本研究的模型基于U-Net架构进行了部分改进:

  • 卷积层被替换为残差结构
  • 最大池化层用步长为2的卷积层代替
  • 网络的宽度和深度根据应用场景设定。

 

2. 检测的CNN网络

检测网络实现的目标:(1)分离检测到的目标;(2)正确识别目标。

本研究的模型基于RetinaNet进行了部分改进:

  • 在特征金字塔上增加了一层,以检测小目标;
  • RetinaNet提取特征的骨干网络为ResNet101;
  • 采用NMS移除多余的边界框。

此外,模型还结合了focal loss解决样本不平衡的问题。

3. 网络融合

分割模型提取的特征在定位方面表现优异,但难以分割或识别目标;

检测模型提取的特征在识别上效果很好,但是recall高precision低。

模型执行的步骤:

  • 采用分割模型提取影像中每个像元的预测值。这是定位的过程。
  • 将目标检测器应用在定位获得的正值区域。考虑到目标检测模型的位移不变性,这个过程是可迭代的:(1)应用检测模型;(2)从分割图中移除检测到的目标。
  • (可选) 研究预测图中剩余的正值区域以提高recall;考虑到被检测飞机的大小或距离,将目标添加到检测列表中。

三、 实验

1. 数据信息

三级数据标签表示法:类型(飞机)——功能(轰炸机、运输机等)——类别(F-16、Tu-95等)。

分辨率30-50cm,切片512×512(128的重叠)。

 

2. 模型参数信息

分割模型采用的是类别加权交叉熵;

检测器训练时,采用focal loss进行分类,smooth L1 loss进行回归;

增加了分类的权重(回归权重的1.5倍),NMS的阈值为0.35;

两个模型都可以通过改变预测阈值(prediction threshold)和最小尺寸(minimum size)来进行recall和precision平衡模式的调整。

版权声明:本文为CSDN博主「糯米丸子TAT」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/MLH7M/article/details/122106884

糯米丸子TAT

我还没有学会写个人说明!

暂无评论

发表评论

相关推荐

YOLOX笔记

目录 1. 样本匹配 正负样本划分过程 2. yoloxwarmcos 学习率 3. 无法开启多gpu训练, 或者多gpu训练卡住? 1. 样本匹配 正负样本划分过程 说明: gt_centerbbox是在gt_bbox中心点向四周