文章目录[隐藏]
这篇论文来自preligens,同时采用了分割和检测算法来实现遥感影像飞机的检测和识别,创造性的将分割和检测两类算法进行了融合,提高了检测识别的精度和效率。
一、引言
- 介绍背景、CNN的发展和作用、分割网络和检测网络的代表性类型;
- 本文中,作者试图找到一种高效且鲁棒的能够解决飞机检测识别问题的方法。因此,作者提出了一个基于不同CNN模型的混合方法:一个基于U-Net的分割网络,用于更高效的检测(better detection rate);一个基于RetinaNet的检测模型,用于识别并提高精度(identifying and improving the precision)。
二、方法
混合模型各部分选择的前提:(1)改变训练模式会引起模型内部特征提取方式的改变;(2)分割模型非常有效,但是在目标的分割和识别中效果较差;(3)在高分辨率的卫星影像中,飞机的尺寸是有限的。
1. 分割的CNN网络
分割网络实现的目标:(1)检测飞机(无需识别);(2)获得高的recall(尤其是在位置信息上);(3)鲁棒性强。
本研究的模型基于U-Net架构进行了部分改进:
- 卷积层被替换为残差结构;
- 最大池化层用步长为2的卷积层代替;
- 网络的宽度和深度根据应用场景设定。
2. 检测的CNN网络
检测网络实现的目标:(1)分离检测到的目标;(2)正确识别目标。
本研究的模型基于RetinaNet进行了部分改进:
- 在特征金字塔上增加了一层,以检测小目标;
- RetinaNet提取特征的骨干网络为ResNet101;
- 采用NMS移除多余的边界框。
此外,模型还结合了focal loss解决样本不平衡的问题。
3. 网络融合
分割模型提取的特征在定位方面表现优异,但难以分割或识别目标;
检测模型提取的特征在识别上效果很好,但是recall高precision低。
模型执行的步骤:
- 采用分割模型提取影像中每个像元的预测值。这是定位的过程。
- 将目标检测器应用在定位获得的正值区域。考虑到目标检测模型的位移不变性,这个过程是可迭代的:(1)应用检测模型;(2)从分割图中移除检测到的目标。
- (可选) 研究预测图中剩余的正值区域以提高recall;考虑到被检测飞机的大小或距离,将目标添加到检测列表中。
三、 实验
1. 数据信息
三级数据标签表示法:类型(飞机)——功能(轰炸机、运输机等)——类别(F-16、Tu-95等)。
分辨率30-50cm,切片512×512(128的重叠)。
2. 模型参数信息
分割模型采用的是类别加权交叉熵;
检测器训练时,采用focal loss进行分类,smooth L1 loss进行回归;
增加了分类的权重(回归权重的1.5倍),NMS的阈值为0.35;
两个模型都可以通过改变预测阈值(prediction threshold)和最小尺寸(minimum size)来进行recall和precision平衡模式的调整。
版权声明:本文为CSDN博主「糯米丸子TAT」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/MLH7M/article/details/122106884
暂无评论