文章目录[隐藏]
深度学习论文: Remote Sensing Image Object Detection Based on Angle Classification
Remote Sensing Image Object Detection Based on Angle Classification
PDF: https://ieeexplore.ieee.org/stamp/stamp.jsp?tp=&arnumber=9521517
1 概述
任意方向的目标检测是一项具有挑战性的任务。由于遥感图像中的物体方向是任意的,使用水平边界框会导致检测精度低。现有的基于回归的旋转检测器会导致边界不连续的问题。
提出的基于角度分类的遥感图像目标检测方法,该方法使用带有角度信息的旋转检测边界框来检测对象。
2 Architecture
首先利用RetinaNet特征提取网络对遥感图像中的特征进行提取,利用NAS-FPN对提取的特征进行融合,得到不同尺度的特征图。然后,使用长边定义方法来表示旋转检测框,并在框回归任务中使用二进制编码标记技术将角度回归问题转化为角度分类问题。
2-1 NAS-FPN
NAS-FPN特征图的搜索过程:
1)从特征图节点集中随机选择一个特征图作为输入之一。初始特征图节点集包含五个尺度的特征图,表示为 {C1,C2, C3, C4, C5}。
2)从特征图节点集中随机选择另一个特征图作为另一个输入。
3)选择输出特征图的分辨率。
4)在操作池中选择一个操作对(1)(2)中选择的特征图节点进行操作,产生与输出特征图分辨率相同的特征图,并将该特征图加入到特征图节点集合中选择。
5) 循环重复上述步骤。搜索的终止条件是生成五个与初始特征图分辨率相同的特征金字塔网络,记为{P1, P2, P3, P4, P5}。
2-2 ROTATION DETECTION FRAME
典型的角度编码方法有三种,包括两种不同角度范围的五参数方法和一种八参数方法。
A 角度范围为90°的五参数法(OpenCV定义法):
定义法包含五个参数[x,y,w,h,θ]。其中,x和y为旋转坐标系的中心坐标,θ为旋转坐标系与x轴的锐角,逆时针方向指定为负角,因此角度范围为[−90° , 0); 旋转框的宽度w为旋转框所在的边角,旋转框的高度h为另一边。
B 角度范围为180°的五参数法:
定义法包含五个参数[x,y,w,h,θ]。其中,x和y为旋转坐标系的中心坐标,θ为旋转坐标系与x轴的锐角,逆时针方向指定为负角,顺时针方向为正角,因此角度范围为[−90° , 90°); 旋转框的长边为h, 短边为w.
旋转框的宽度w为旋转框所在的边角,旋转框的高度h为另一边。
C 八参数法:
定义方法包含8个参数[a1,a2,b1,b2,c1,c2,d1,d2], 定义的左上角为起点,其余点按逆时针顺序排列。
[1] X. Yang, S. Hao, K. Fu, J. Yang, S. Xian, M. Yan, and G. Zhi, Automatic ship detection in remote sensing images from Google earth of complex scenes based on multiscale rotation dense feature pyramid networks
[2] M. Liao, B. Shi, and X. Bai, TextBoxesCC: A single-shot oriented scene text detector
[3] Y. Liu, S. Zhang, L. Jin, L. Xie, Y. Wu, and Z. Wang, Omnidirectional scene text detection with sequential-free box discretization
[4] Y. Xu, M. Fu, Q. Wang, Y. Wang, K. Chen, G.-S. Xia, and X. Bai, Gliding vertex on the horizontal bounding box for multi-oriented object detection
2-3 ANGLE CODING METHOD
但是由于五参数法角度周期性 (periodicityof angular,PoA) 以及边的交换性 (exchangeabilityof edges,EoE) 和八参数法角点排列顺序会带来边界不连续(boundary discontinuity )问题。
作者采用了Dense Label Encoding for Boundary Discontinuity Free Rotation Detection中提出的角度编码方法
3 EXPERIMENTAL
版权声明:本文为CSDN博主「mingo_敏」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/shanglianlm/article/details/121246383
暂无评论