深度学习与图像识别:原理与实践 笔记Day_18(目标检测)续

文章目录[隐藏]

SSD

SSD同时借鉴了YOLO网络的思想和Faster R-CNN的anchor机制,使SSD可以在进行快速预测的同时又可以相对准确地获取目标的位置。

(b)和(c)分别代表不同的特征层,图c相对于图b离最终的预测结果较近,因此其跨越同样像素个数能检测的目标就更大。如b所示,在特征层的每个结点上都将产生4个不同大小的anchor(1:1两个,1:2两个),如c所示,在特征层上也是如此。根据真是目标矩形框与每个anchor的IOU大小计算可知,b中包含2个anchor为正样本,c中只有1个。 

SSD的一些特点:

  1. 使用多尺度特征层进行检测。在Faster R-CNN的RPN中,anchor是在干网络的最后一个特征层上生成的,而在SSD中,anchor不仅是在最后一个特征层上产生的,而且在几个高层特征层处同时也在产生anchor。这些层大小依次递减,使得SSD可以检测不同尺度的目标。
  2. SSD中所有特征层产生的anchor都将经过正负样本的筛选,然后进行分类分数以及Bbox位置的学习。即特征层上生成的正负样本将直接进行最终的分类(ClassNum个类别)以及Bbox的学习,不像Faster R-CNN那样先在第一步学习是否有物体(只有0/1两个类别)以及Bbox位置,然后在第二步学习最终的分类(ClassNum个类别)以及对Bbox位置的微调。

在实际应用时,我们不仅要关注精度,很多情况下还要考虑速度,比如对视频内容进行实时地检测,这时候我们就希望又方法很好地进行速度和精度的平衡。

版权声明:本文为CSDN博主「努力卷」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/qq786558544/article/details/120912836

努力卷

我还没有学会写个人说明!

暂无评论

发表评论

相关推荐

TensorRTX 推演

前言 在github上下载到yolov5的第5版及其对应的tensorRTX版本,在目标硬件平台进行部署推演。 GitHub上tensorRTX步骤 (1)下载好tensorrtx中yolov5文

【原理篇】一文读懂Mask RCNN

Mask RCNN 何凯明大神的经典论文之一,是一个实例分割算法,正如文中所说,Mask RCNN是一个简单、灵活、通用的框架,该框架主要作用是实例分割,目标检测&#xff0

YOLO-V3-SPP详细解析

YOLO-V3-SPP 继前两篇简单的YOLO博文 YOLO-V1 论文理解《You Only Look Once: Unified, Real-Time Object Detection》YOLO-V2论文理解《YOLO9000: Bet