首页 » 机器视觉 » 正文

Oriented R-CNN：面向旋转目标检测的 R-CNN（ICCV2021）

2024-04-30 205 0

文章目录[隐藏]

一. 旋转目标检测——研究现状
二. 《Oriented R-CNN for Object Detection》文章简介
三. 《Oriented R-CNN for Object Detection》文章详解
四. 实验结果

论文链接：《Oriented R-CNN for Object Detection》
代码链接：https://github.com/jbwang1997/OBBDetection

本文提出一种通用的两阶段旋转目标检测器，具有良好的准确性和效率，表现SOTA！性能优于Mask OBB、SCRDet等网络，代码现已开源！作者单位：西北工业大学

前言：文章是旋转目标检测的新作，旋转目标检测作为近几年被认可的研究领域（之前没有相关数据集，审稿人也不是很认可）
所以，有必要先介绍一下旋转目标检测的研究现状和数据集，不需要的同学可以跳过

一. 旋转目标检测——研究现状

1.1. 之前的算法

在这里插入图片描述

图1. DOTA旋转目标赛道实时排名（2019年12-22）

1.2. 旋转目标检测——数据集

在这里插入图片描述

多半都是遥感目标检测相关：
也有少部分物体的：
- DRN：用于旋转和密集目标检测的动态优化网络
  - 论文下载链接：https://arxiv.org/abs/2005.09973
  - 代码和数据集：https://github.com/Anymake/DRN_CVPR2020

1.3. 开源代码

https://github.com/SJTU-Thinklab-Det/DOTA-DOAI

二. 《Oriented R-CNN for Object Detection》文章简介

当前最先进的两级检测器通过耗时的方案生成定向建议。这降低了检测器的速度，从而成为先进的面向对象检测系统的计算瓶颈。
这项工作提出了一种有效且简单的面向对象检测框架，称为 Oriented R-CNN，它是一种通用的两阶段面向检测器，具有良好的准确性和效率。
具体来说，在第一阶段，我们提出了一个面向区域提案网络（orientation RPN），它以几乎免费的方式直接生成高质量的面向提案。第二阶段是面向 R-CNN 头，用于细化面向的兴趣区域（面向的 RoI）并识别它们。
在没有技巧的情况下，带有 ResNet50 的面向 R-CNN 在两个常用的面向对象检测数据集上实现了最先进的检测精度，包括 DOTA (75.87% mAP) 和 HRSC2016 (96.50% mAP)，同时速度为 15.1图像大小为 1024 的 FPS1024 在单个 RTX 2080Ti 上。我们希望我们的工作能够激发对定向检测器设计的重新思考，并作为定向目标检测的基准。
在这里插入图片描述

图1:生成面向对象提案的不同方案的比较。

(a)旋转RPN密集放置不同尺度、比例和角度的旋转锚。
(b)RoI Transformer+从水平RoI中学习面向的建议。它包括RPN、RoI校准和回归。
©我们提出的面向对象的RPN。定向RPN的参数数约为RoI Transformer+的1/3000，旋转RPN的1/15。

三. 《Oriented R-CNN for Object Detection》文章详解

在这里插入图片描述

图2:oriented R-CNN的总体框架，它是基于FPN的两级检测器。

第一阶段通过有向RPN生成有向提案，第二阶段是有向R-CNN头部对提案进行分类并细化其空间位置。为了更清楚地说明，我们没有显示面向RPN中的FPN以及分类分支。
在这里插入图片描述

图3:中点偏移表示的说明。

(a)中点偏移表示示意图。(b)中点偏移表示示例。

在这里插入图片描述

图4:盒子回归参数化的说明

黑点是顶部和右侧的中点，橙色的点是有方向的边界框的顶点。
(a) Anchor (b)Ground truth box©预测的box。

图5:旋转RoIAlign的过程示意图

蓝框是有向RPN生成的平行四边形提案
最左边的红框是其对应的用于投影和旋转RoIAlign的矩形提案。

四. 实验结果

在这里插入图片描述

图7:使用R-50-FPN骨干的oriented R-CNN在DOTA数据集上的检测结果示例

当可视化这些结果时，置信阈值被设置为0.3。一种颜色代表一个对象类

图8:HRSC2016数据集上使用R-50-FPN骨干的面向R-CNN检测结果示例

显示分数高于0.3的定向包围框

版权声明：本文为CSDN博主「凌青羽」的原创文章，遵循CC 4.0 BY-SA版权协议，转载请附上原文出处链接及本声明。
原文链接：https://blog.csdn.net/qq_35759272/article/details/119682488

凌青羽

我还没有学会写个人说明！

查看作者页面

暂无评论

发表评论取消回复

要发表评论，您必须先登录。

相关推荐

基于mmdetection 旋转目标检测（OBB detection)+DOTA数据集&自定义数据集+配docker

机器视觉 2023-05-09

基于mmdetection 旋转目标检测（OBB detection)+DOTA数据集&自定义数据集+配docker

这两周得益于组里的任务需求，肝了一个遥感类的飞机旋转框目标检测，在给定的4096*4096的大尺度分辨率图片上去识别检测飞机。经过模型检测后输出结果图如下图所示：可以看到最终的结果还是不错的&#

计算机视觉与深度学习 | 基于Faster R-CNN的目标检测（深度学习Matlab代码）

机器视觉 2025-08-13

计算机视觉与深度学习 | 基于Faster R-CNN的目标检测（深度学习Matlab代码）

===================================================== github：https://github.com/MichaelBeechan CSDN：https://blog.csdn.net/

【目标检测】YOLO、SSD、CornerNet原理介绍

机器视觉 2025-08-12

【目标检测】YOLO、SSD、CornerNet原理介绍

目标检测是计算机视觉中比较简单的任务，用来在一张图篇中找到某些特定的物体，目标检测不仅要求我们识别这些物体的种类，同时要求我们标出这些物体的位置。其中类别是离散数据，位置是连续数据。目

目标检测篇之---YOLO系列

机器视觉 2025-08-10

目标检测篇之---YOLO系列

YOLO系列首先先说一下目标检测之one-stage和two-stage网络是什么意思？有什么区别？刚开始看目标检测的时候总能看见单阶段（one-stage）和两阶段（