DETReg: Unsupervised Pretraining with Region Priors for Object Detection (2021)

1. 出处

2021 CVPR 貌似没中,我在谷歌学术和微软学术上都没搜到

2. 问题

已有的自监督方法不是专门为了检测中的一个重要任务——定位物体而设计的。

大多数已有的自监督方法只学习检测网络的部分结构,通常只是检测器的子网络,比如ResNet,只学习backbone对于检测模型是远远不够的。

3. 解决方案

提出了一个使用Region priors的Transformer进行目标检测的无监督预训练方法,叫作DETReg。作者受目标检测两个任务(分类和定位)的启发,合并自监督中两个互补的信号。

  1. 对于目标定位信号,使用现成的无监督区域生成方法,选择性搜索算法作为伪gt bbox,这种方法不需要训练,是一种低精度高召回率的方法。
  2. 分类信号来自目标embedding损失,鼓励不变的目标表示,通过这种方式推理目标类别。

DETReg通过引入2个关键的预训练任务,在无标签的数据上训练一个检测器,这两个任务分别是:

  1. 目标定位任务
    这个任务的目标是不管类别是什么,训练模型来定位目标

  2. 目标嵌入任务
    理解图像中目标的类别
    作者使用SwAV来获得潜在目标的embeddings,并使用这些在预训练的时候监督DETReg目标embeddings。

4. 过程细节

4.1 选择性搜索算法

选择性搜索算法尝试对region proposals进行排序,因此更有可能是目标的物体排序在前。但region proposals数量巨大,排序不精确,因此,作者提出一种机制选择最好的在训练时作为proposals.
Top-K原则
Random-K原则
重要性采样

4.2 整体结构

在这里插入图片描述

4.3 设计了2个预训练任务

  • 目标定位任务

    以M个选择性搜索算法产生的bbox作为输入,通过最小化DETR预测和这M个框之间的不同来优化损失函数。

  • 目标嵌入任务

    使用SwAV对选择性搜索算法产生的M个框选出的图像区域学习表征

5. 启发

  1. DETReg的优势

    • 无监督,不需要任何标注
    • 训练所有的DETR模型参数,不是只训练backbone
  2. DETR
    DETR首次建立了end-to-end目标检测器,消除了对anchor和NMS后处理的需要

  3. 用的现成的选择性搜索算法用于框定目标

版权声明:本文为CSDN博主「TEn%」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/qq_37297763/article/details/120970861

TEn%

我还没有学会写个人说明!

暂无评论

发表评论

相关推荐

【三维目标检测】---3D IoU Net论文解读,预测IoU

代码链接 paper链接 个人博客 问题 本文首先说明了一个问题就是NMS是一个非常重要的去除预测结果中重复的后处理过程。一些工作已经发现在NMS中使用IOU来作为排序的标准能够取得更好的效果。这里作者还用一个实验证明了上述说法的正确性

【论文阅读】2d目标检测:综述

最近在恶补2d目标检测的文章,把他们整理了一下,写一下综述,方便以后查看。 写得比较简略,主要是自己对于 一些网络的理解。 - sppnet 本文引入了一种针对不同尺度图片的目标检