Frustratingly Simple Few-Shot Object Detection论文解读

Frustratingly Simple Few-Shot Object Detection

摘要:小样本检测还很新,作者通过预训练-微调的方法取得了比元学习好2-20个点的效果,并且作者针对高方差的小样本检测效果提出了VOC和COCO数据集的新基准。代码的github地址为:https://github.com/ucbdrive/few-shot-object-detection

介绍

  • 作者首先是说了一些背景,比如人类可以迅速识别新事物等等,与小样本分类类似,然后提到了的元学习方法,我之前做过其中一篇的论文解读,详见Few-shot Object Detecion via Feature Reweighting论文解读.
  • 作者指出,与图像分类不同,目标检测需要模型不仅识别出目标类别,还需要在数百万个潜在区域中定位目标。这个额外的子任务大大提高了整体的复杂性。一些方法将元学习器附加到现有的目标检测网络中,遵循元学习方法进行分类。但是,目前的评估方案存在统计上的不可靠性,并且那些论文中的基线方法,特别是简单的微调的方法,在小样本检测上的准确性与文献中并不一致。
  • 作者针对微调的方法,在模型设计和基于微调的训练中,重点研究了目标检测器的训练计划和实例级特征归一化。
  • 针对检测精度方差大的问题提出多组实验取平均的指标,相较于之前的工作,作者不只报告了新颖类的效果,还报告了基础类的效果。

模型框架

在这里插入图片描述
步骤:

  • 基础类训练
  • 冻结Faster RCNN参数,微调分类器和回归器
  • 在微调阶段的分类器中引入实例级特征归一化(即使用余弦分类器)
    emmm好像这个方法就是一个非常简单的finetune方法,所以没什么继续讲的了

实验

实现细节

  • Faster RCNN框架
  • 使用带有FPN结构的ResNet-101作为骨干网络
  • 优化器:SGD,batch size 16,momentum 0.9,weight decay 0.0001
  • 学习率:预训练 0.02,微调 0.001

Benchmarks

PASCAL VOC数据集结果

  • 三个划分新颖类的AP50
    在这里插入图片描述
  • 第一种划分下,3shot和10shot的基础类和新颖类的AP50
    在这里插入图片描述

COCO数据集结果

在这里插入图片描述

LVIS数据集

在这里插入图片描述

通用的小样本目标检测基准

  • 问题:
    • 以前的评估协议只关注于新类的性能。这忽略了基类中潜在的性能下降,从而忽略了网络的总体性能。
    • 由于用于训练的样本较少,样本方差较大。这使得从与其他方法的比较中得出结论变得困难,因为在性能上的差异可能是微不足道的。
  • 解决:
    • 使用随机样本进行多次训练,求出平均值和95%置信区间,在PASCAL VOC数据集的第一个划分中重复40次的效果如下图:
      在这里插入图片描述

新基准下的结果

  • PASCAL VOC
    在这里插入图片描述
  • COCO
    在这里插入图片描述

消融实验

分类器的初始化

  • 随机初始化
  • 使用分类器的权重初始化并进行微调
    在这里插入图片描述

余弦相似度的缩放因子

  • 对比了10,20,50. 作者选择的是20
    在这里插入图片描述

版权声明:本文为CSDN博主「海南1506」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/weixin_44340538/article/details/122623103

海南1506

我还没有学会写个人说明!

暂无评论

发表评论

相关推荐