对mmdetection代码设计的简单理解及代码修改

代码的整体结构及每部分含义网络上已有很多资料，这里不再赘述。但网上很少见到对mmdetection代码设计模式的讲解，所以记录一下自己的理解，及快速修改代码的方式吧（以faster-rcnn为例）。

为了更简单的理解mmdetection的设计，我打算从修改rpn proposal的采样代码说起。rpn proposal的采样目的是在一堆anchor中选择其中一部分，作为proposal，在rpn网络中用于回归bbox及正负例的分类。因此先看rpn在整个faster-rcnn流程中所处的位置：它在mmdet->models->detectors->two_stage.py中。
在这里插入图片描述

图1
two_stage.py代表的并不是faster-rcnn，而是一个二阶段网络的训练框架。这个二阶段网络可以是cascade_rcnn，double_head_rcnn等，由于它们都是二阶段网络，因此把它们共性的部分抽取出来，写成了two_stage.py这个文件，当具体到要使用faster-rcnn时，再对two_stage.py加上faster-rcnn的配置。增加方法是在配置文件faster_rcnn_r50_fpn_1x_lvis.py（以下简称cfg文件）中，model的type设置为’FasterRCNN’。但是这个设置是怎么起作用的呢？

先看mmdet->models->detectors->faster_rcnn.py的头文件：

from ..registry import DETECTORS
from .two_stage import TwoStageDetector

这里导入了TwoStageDetector包，而TwoStageDetector正是定义在two_stage.py中的类。
再看FasterRCNN类：

@DETECTORS.register_module
class FasterRCNN(TwoStageDetector):

FasterRCNN类继承了TwoStageDetector，那就拥有了TwoStageDetector的全部属性，并且配置遵循FasterRCNN类。

再回过头看看mmdet->models->detectors->faster_rcnn.py中detectors这个文件夹。文件夹下有__init__.py文件，

__all__ = [
    'BaseDetector', 'SingleStageDetector', 'TwoStageDetector', 'RPN',
    'FastRCNN', 'FasterRCNN', 'MaskRCNN', 'CascadeRCNN', 'HybridTaskCascade',
    'DoubleHeadRCNN', 'RetinaNet', 'FCOS', 'GridRCNN', 'MaskScoringRCNN',
    'RepPointsDetector', 'FOVEA', 'GroupSoftmax', 'DCM'
]

包含了’TwoStageDetector’和’FasterRCNN’两个类。

至此对mmdetection代码设计做一个小小的总结。mmdetection先把模型抽象成一个共性结构two_stage.py，然后通过cfg文件中的字段给这个共性结构增加相应的属性，使之变成一个具体的模型，如faster-rcnn。增加相应属性的方式是：为这个属性单独写一个类，并且继承这个共性结构。为了让这个属性得以调用，还需修改当前文件夹下__init__.py文件。mmdetection这种设计非常方便，如果需要修改共性结构，则直接改two_stage.py，若要增加属性直接写一个文件，这样代码结构就十分清晰，书写方便。

除了模型代码是按上述方式设计，模型中每个模块的设计方式类似，就不举例了。

现在可以开始修改rpn proposal的采样代码了。
先看原始rpn proposal采样在cfg文件中的样子：
在这里插入图片描述