文章目录[隐藏]
弱监督目标检测
弱监督目标检测的解决方案
-
基于多示例学习的弱监 督目标检测算法
-
基于类激活图的弱监督目标检测算法
-
基于注意力机制的弱监督目标检测算法
-
基于伪标签的弱监督目标检测算法
弱监督目标检测主要面临的问题
-
定位的精度(主要指由于没有精确的标签导致定位框主要关注于特征的部位)
discriminative region problem-显著区域问题
-
推理速度(SS,EB等先验框生成算法占用时间)
-
多实例问题(一张图片中一个类别存在多个目标时,往往只有一个目标可以被检测出来)
经典方法
MIL-based Methods
- WSDDN(开山之作)
- OICR(引入两个全连接层对目标框进行二次调整)
- SDCN(引入分割检测的机制与目标检测协同工作)
- ICMWSD(利用上下文信息随机丢弃目标框)
CAM-based Methods
- CAM(首次使用类别激活图来预测目标,缺点就是目标框大多只关注于特征部位)
- WCCN(将CAM,segmentation,MIL三种思想融为一体)
- ACoL(引入两个平行分类器,互补对抗学习解决显著区域问题)
针对显著性区域问题的一些解决办法
-
上下文建模
-
自训练算法
-
级连网络
-
边界框回归
-
显著区域移除
-
低层次特征图融合
-
分割协作机制
-
半监督向全监督迁移
针对多实例标签问题的一些解决办法
- 根据节点之间的距离及其交并比
针对多多实例方法速度慢的一些解决办法(SS,EB)
- 迁移学习的思想利用全监督生成伪标签
- 在特征图上进行滑动窗口
- 利用热力图来生成检测框
训练技巧
- 从易到难
- 低分数区域否定策略
- 光滑标签损失函数优化策略
相关的数据集
- PASCAL VOC
- MSCOCO
- ILSVRC
- CUB-200
评价标准
-
mAP (mean Average Precision)平均精准度
这一项几乎所有目标检测都有
-
CorLoc (Correct Localization)正确定位
这一项我感觉应该是弱监督专门引入的
-
Top Error 最高错误率
imagenet分类里面就已经有了
各个数据集上弱监督学习的性能情况
- Pascal VOC
- mAP 52.1% in CVPR’20
- MSCOCO
- AP:11.4 AP@0.5 :24.3
- CUB-200-2011
- 1-err cls,5-err cls: 24.6,7.7 | 1-err loc,5-err loc:42.54,34.97
- ILSVRC 2012
- 1-err cls,5-err cls: 27.7,12.0 | 1-err loc,5-err loc:49.83,35.05
未来的发展方向
- Better Initial Proposals
- Better Positive Proposals
- Lightweight Network
Deep Learning for Weakly-Supervised Object Detection and Object Localization: A Survey
版权声明:本文为CSDN博主「Ivan's」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/qq_26024067/article/details/121397636
暂无评论