文章目录[隐藏]

这篇论文来自preligens，同时采用了分割和检测算法来实现遥感影像飞机的检测和识别，创造性的将分割和检测两类算法进行了融合，提高了检测识别的精度和效率。

一、引言

介绍背景、CNN的发展和作用、分割网络和检测网络的代表性类型；
本文中，作者试图找到一种高效且鲁棒的能够解决飞机检测识别问题的方法。因此，作者提出了一个基于不同CNN模型的混合方法：一个基于U-Net的分割网络，用于更高效的检测(better detection rate)；一个基于RetinaNet的检测模型，用于识别并提高精度(identifying and improving the precision)。

二、方法

混合模型各部分选择的前提：（1）改变训练模式会引起模型内部特征提取方式的改变；（2）分割模型非常有效，但是在目标的分割和识别中效果较差；（3）在高分辨率的卫星影像中，飞机的尺寸是有限的。

1. 分割的CNN网络

分割网络实现的目标：（1）检测飞机（无需识别）；（2）获得高的recall（尤其是在位置信息上）；（3）鲁棒性强。

本研究的模型基于U-Net架构进行了部分改进：

卷积层被替换为残差结构；
最大池化层用步长为2的卷积层代替；
网络的宽度和深度根据应用场景设定。

2. 检测的CNN网络

检测网络实现的目标：（1）分离检测到的目标；（2）正确识别目标。

本研究的模型基于RetinaNet进行了部分改进：

在特征金字塔上增加了一层，以检测小目标；
RetinaNet提取特征的骨干网络为ResNet101；
采用NMS移除多余的边界框。

此外，模型还结合了focal loss解决样本不平衡的问题。

3. 网络融合

分割模型提取的特征在定位方面表现优异，但难以分割或识别目标；

检测模型提取的特征在识别上效果很好，但是recall高precision低。

模型执行的步骤：

采用分割模型提取影像中每个像元的预测值。这是定位的过程。
将目标检测器应用在定位获得的正值区域。考虑到目标检测模型的位移不变性，这个过程是可迭代的：（1）应用检测模型；（2）从分割图中移除检测到的目标。
(可选) 研究预测图中剩余的正值区域以提高recall；考虑到被检测飞机的大小或距离，将目标添加到检测列表中。

三、实验

1. 数据信息

三级数据标签表示法：类型（飞机）——功能（轰炸机、运输机等）——类别（F-16、Tu-95等）。

分辨率30-50cm,切片512×512（128的重叠）。

2. 模型参数信息

分割模型采用的是类别加权交叉熵；

检测器训练时，采用focal loss进行分类，smooth L1 loss进行回归；

增加了分类的权重（回归权重的1.5倍），NMS的阈值为0.35；

两个模型都可以通过改变预测阈值(prediction threshold)和最小尺寸(minimum size)来进行recall和precision平衡模式的调整。

版权声明：本文为CSDN博主「糯米丸子TAT」的原创文章，遵循CC 4.0 BY-SA版权协议，转载请附上原文出处链接及本声明。
原文链接：https://blog.csdn.net/MLH7M/article/details/122106884

【论文】Concurrent Segmentation and Object Detection CNNs for Aircraft Detection and Identification

一、引言

二、方法

1. 分割的CNN网络

2. 检测的CNN网络

3. 网络融合

三、实验

1. 数据信息

2. 模型参数信息

机器视觉资讯20240416

YOLOV5训练自己的无人车避坑（障）系统

糯米丸子TAT

暂无评论

发表评论取消回复

一、引言

二、方法

1. 分割的CNN网络

2. 检测的CNN网络

3. 网络融合

三、 实验

1. 数据信息

2. 模型参数信息

机器视觉资讯20240416

YOLOV5训练自己的无人车避坑（障）系统

糯米丸子TAT

暂无评论

发表评论 取消回复

相关推荐

三、实验

发表评论取消回复