mmdetection中faster-rcnn的proposals正负例构成代码

proposals由下图所示proposal模块产生,proposal模块在整个faster-rcnn网络中的位置如下图:
faster-rcnn结构图图中proposal模块做了两件事,最终输出为指定数目的包含正负例的proposals。在proposal模块的一系列操作中,本文只关注proposal模块中构成proposals正负例的代码。

先简单描述一下给proposals打上正负例标签的做法。faster-rcnn原文中,从一堆anchor给proposals打上正负标签的办法,是使用softmax模块,如上图所示。但mmdetection中似乎没有softmax模块,而是用以下过程替代:直接在一大堆anchor中根据anchor和gt的重合程度(IoU),来设定正负例。

然后看代码。从上述给proposal打正负例标签的做法中可以看出,首先要获取IoU,为了获取IoU,先要知道每一个anchor的4个坐标点的数值。这4个坐标点数值是在rpn_head.py文件获得的,在rpn_head.py中与之相关的两个代码段如图1和图2所示,
rpn1 图1
rpn2
图2
这里对一个样本(一张图片)所有的anchors给出了4个坐标点位置和每个anchor的分类分数,分别存在两个变量中:rpn_bbox_pred和rpn_cls_score。

接着要对这堆anchor打上正负例标签。这里以mmdetection中其中一个打标签方式MaxIoUAssigner为例(在max_iou_assigner.py文件中)。正例的标签都设置为实际标签值(都是大于0的整数),负例的标签都设为0,这里只记录负例的打标签方式。
assigner图3
从代码(图3)中可看出,max_overlaps和neg_iou_thr两个变量共同决定了哪个区间的IoU为负例。

正负例都打上标签了,但是这些打上标签的anchor并不是proposals最终构成,还要经过一个采样的步骤。因为此时proposals的总数太多了,需要通过采样减少数目。这里以mmdetection中其中一个采样方式RandomSampler为例(在文件random_sampler.py中)。

在这里插入图片描述
图4

从代码(图4)中可看出,_sample_pos和_sample_neg分别对打过标签的正负例anchor进行随机采样,采样数目由num_expected决定的,num_expected是根据配置文件中的预设值计算得来,计算过程在文件base_sampler.py中。

参考:
1.一文读懂Faster RCNN

版权声明:本文为CSDN博主「FaiComeVuoi」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/chenxi1900/article/details/122439455

FaiComeVuoi

我还没有学会写个人说明!

暂无评论

发表评论

相关推荐

目标检测——yolov3论文精读

📝论文下载 Abstract(摘要) YOLOv3在YOLO的基础上做了一些更新,重点在于提升检测的精度。当图片的分辨率为320 × 320,YOLOv3只使用了22 ms进行检测, m

emgucv4学习21---emgucv+ssd目标检测+vs2019

之前也写过yolov3、yolov4部署在C#上,具体的可以参考下面的博客。可能很多人感觉为啥要用emgucv进行部署呢,我也可以用Opencv、openvino部署,这些也是可以的,甚至可以导出dll给C#调用,总之部署有很多方法。在C#上部