mmdetection中faster-rcnn的proposals正负例构成代码

proposals由下图所示proposal模块产生,proposal模块在整个faster-rcnn网络中的位置如下图:
faster-rcnn结构图图中proposal模块做了两件事,最终输出为指定数目的包含正负例的proposals。在proposal模块的一系列操作中,本文只关注proposal模块中构成proposals正负例的代码。

先简单描述一下给proposals打上正负例标签的做法。faster-rcnn原文中,从一堆anchor给proposals打上正负标签的办法,是使用softmax模块,如上图所示。但mmdetection中似乎没有softmax模块,而是用以下过程替代:直接在一大堆anchor中根据anchor和gt的重合程度(IoU),来设定正负例。

然后看代码。从上述给proposal打正负例标签的做法中可以看出,首先要获取IoU,为了获取IoU,先要知道每一个anchor的4个坐标点的数值。这4个坐标点数值是在rpn_head.py文件获得的,在rpn_head.py中与之相关的两个代码段如图1和图2所示,
rpn1 图1
rpn2
图2
这里对一个样本(一张图片)所有的anchors给出了4个坐标点位置和每个anchor的分类分数,分别存在两个变量中:rpn_bbox_pred和rpn_cls_score。

接着要对这堆anchor打上正负例标签。这里以mmdetection中其中一个打标签方式MaxIoUAssigner为例(在max_iou_assigner.py文件中)。正例的标签都设置为实际标签值(都是大于0的整数),负例的标签都设为0,这里只记录负例的打标签方式。
assigner图3
从代码(图3)中可看出,max_overlaps和neg_iou_thr两个变量共同决定了哪个区间的IoU为负例。

正负例都打上标签了,但是这些打上标签的anchor并不是proposals最终构成,还要经过一个采样的步骤。因为此时proposals的总数太多了,需要通过采样减少数目。这里以mmdetection中其中一个采样方式RandomSampler为例(在文件random_sampler.py中)。

在这里插入图片描述
图4

从代码(图4)中可看出,_sample_pos和_sample_neg分别对打过标签的正负例anchor进行随机采样,采样数目由num_expected决定的,num_expected是根据配置文件中的预设值计算得来,计算过程在文件base_sampler.py中。

参考:
1.一文读懂Faster RCNN

版权声明:本文为CSDN博主「FaiComeVuoi」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/chenxi1900/article/details/122439455

FaiComeVuoi

我还没有学会写个人说明!

暂无评论

发表评论

相关推荐

读取xml文件中的信息

VOC格式标签:图片的实际宽和高,标注框的左上角和右下角坐标YOLO格式标签:标注框的中心坐标(归一化的),标注框的宽和高(归一化的&#xff09

【目标检测】YOLO、SSD、CornerNet原理介绍

目标检测是计算机视觉中比较简单的任务,用来在一张图篇中找到某些特定的物体,目标检测不仅要求我们识别这些物体的种类,同时要求我们标出这些物体的位置。其中类别是离散数据,位置是连续数据。 目

目标检测篇之---YOLO系列

YOLO系列 首先先说一下目标检测之one-stage和two-stage网络是什么意思?有什么区别? 刚开始看目标检测的时候总能看见单阶段(one-stage)和两阶段(