文章目录[隐藏]
HBB:horizontal Bounding Boxes 水平边界框
OBB:oriented Bounding Boxes 带方向的(倾斜)边界框
1 introduction
(1) 航空影像目标检测与传统目标检测的区别
- 航空影像目标尺寸差异很大
- 航空影像中很多小目标密集分布,且类别不均衡
- 航空影像中的目标可能是任意方向的
除此之外,数据集的问题也是航空影像目标检测面临的挑战之一。
(2) 主要内容
本研究介绍了一个大型的目标检测数据集。该数据集包含了286张来自不同传感器和平台的航空影像,每张影像大小都在4000×4000pixel内,分为15种类别,188282个目标,每个目标都标记为一个带方向的边界框。
(3)好的数据集的特征
- 数据量大
- 每类有足够多目标
- 目标标注带有确切的方向
- 类别较多,能反映实际
存在问题:类别单一、缺少方向信息
2. DOTA数据标注
(1)数据源:来自多种传感器和平台的不同分辨率航空影像
(2)类别选择:15类,包括飞机、舰船、储罐、棒球场、网球场、篮球场、田径场、海港、桥梁、大型车辆、小型车辆、直升机、环岛、足球场、游泳池
(3)标注方式
- (x, y, w, h, θ): 不能完全包围各部分变形大的旋转目标
- (x1, y1, x2, y2, x3, y3, x4, y4): 从左上角或者目标头部开始顺时针标注
(4)数据集划分:1/2训练,1/6验证,1/3测试
3. DOTA数据集属性
(1)原始影像大小从800-4000(大部分大于1000), 无切割直接标记
(2)不同方法的目标分布均衡
(3)数据集中提供了每张影像的空间分辨率
(4)类别的不同目标大小分布
(5)目标的不同长宽比:
- 最小外切水平矩形边界的长宽比
- 原始四边形边框的长宽比
(6)影像中不同目标的密度:一个个标注密集分布的目标
4. 评价
(1) 垂直框目标检测:Faster R-CNN1 [26], R-FCN2 [4], YOLOv23 [25] and SSD2 [16]
(2)倾斜框目标检测:改进版的Faster R-CNN
(3)将影像分割成1024×1024,步长512。当目标被切分的面积小于原始面积的0.7,就将其定为difficult。之后,确定被切分的目标能否被四个顺时针顶点的边界框所表示。
(4)评价指标:mAP
(5)水平框检测时,SSD效果很差:分析原因可能是因为SSD在数据增强时会进行随即裁剪操作,导致小目标的检测难度增加。
(6)倾斜框检测时,结果精度比水平框检测低很多。
5. 结果分析
(a) vs. (b): OBB优于HBB
(c) vs. (d): HBB优于OBB: 在OBB中,目标长宽比很大;在HBB中,目标具有正常的长宽比
(e) vs. (f): OBB和HBB效果都不好
版权声明:本文为CSDN博主「糯米丸子TAT」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/MLH7M/article/details/121266993
暂无评论