代码的整体结构及每部分含义网络上已有很多资料,这里不再赘述。但网上很少见到对mmdetection代码设计模式的讲解,所以记录一下自己的理解,及快速修改代码的方式吧(以faster-rcnn为例)。
为了更简单的理解mmdetection的设计,我打算从修改rpn proposal的采样代码说起。rpn proposal的采样目的是在一堆anchor中选择其中一部分,作为proposal,在rpn网络中用于回归bbox及正负例的分类。因此先看rpn在整个faster-rcnn流程中所处的位置:它在mmdet->models->detectors->two_stage.py中。
图1
two_stage.py代表的并不是faster-rcnn,而是一个二阶段网络的训练框架。这个二阶段网络可以是cascade_rcnn,double_head_rcnn等,由于它们都是二阶段网络,因此把它们共性的部分抽取出来,写成了two_stage.py这个文件,当具体到要使用faster-rcnn时,再对two_stage.py加上faster-rcnn的配置。增加方法是在配置文件faster_rcnn_r50_fpn_1x_lvis.py(以下简称cfg文件)中,model的type设置为’FasterRCNN’。但是这个设置是怎么起作用的呢?
先看mmdet->models->detectors->faster_rcnn.py的头文件:
from ..registry import DETECTORS
from .two_stage import TwoStageDetector
这里导入了TwoStageDetector包,而TwoStageDetector正是定义在two_stage.py中的类。
再看FasterRCNN类:
@DETECTORS.register_module
class FasterRCNN(TwoStageDetector):
FasterRCNN类继承了TwoStageDetector,那就拥有了TwoStageDetector的全部属性,并且配置遵循FasterRCNN类。
再回过头看看mmdet->models->detectors->faster_rcnn.py中detectors这个文件夹。文件夹下有__init__.py文件,
__all__ = [
'BaseDetector', 'SingleStageDetector', 'TwoStageDetector', 'RPN',
'FastRCNN', 'FasterRCNN', 'MaskRCNN', 'CascadeRCNN', 'HybridTaskCascade',
'DoubleHeadRCNN', 'RetinaNet', 'FCOS', 'GridRCNN', 'MaskScoringRCNN',
'RepPointsDetector', 'FOVEA', 'GroupSoftmax', 'DCM'
]
包含了’TwoStageDetector’和’FasterRCNN’两个类。
至此对mmdetection代码设计做一个小小的总结。mmdetection先把模型抽象成一个共性结构two_stage.py,然后通过cfg文件中的字段给这个共性结构增加相应的属性,使之变成一个具体的模型,如faster-rcnn。增加相应属性的方式是:为这个属性单独写一个类,并且继承这个共性结构。为了让这个属性得以调用,还需修改当前文件夹下__init__.py文件。mmdetection这种设计非常方便,如果需要修改共性结构,则直接改two_stage.py,若要增加属性直接写一个文件,这样代码结构就十分清晰,书写方便。
除了模型代码是按上述方式设计,模型中每个模块的设计方式类似,就不举例了。
现在可以开始修改rpn proposal的采样代码了。
先看原始rpn proposal采样在cfg文件中的样子:
图2
在train_cfg->rpn->sampler中,类型设置为type = ‘RandomSampler’。根据需求选择mmdet->core->bbox->samplers中相应的采样器,修改这个type字段即可。
版权声明:本文为CSDN博主「FaiComeVuoi」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/chenxi1900/article/details/122590855
暂无评论