文章目录[隐藏]

SSD

SSD同时借鉴了YOLO网络的思想和Faster R-CNN的anchor机制，使SSD可以在进行快速预测的同时又可以相对准确地获取目标的位置。

(b)和(c)分别代表不同的特征层，图c相对于图b离最终的预测结果较近，因此其跨越同样像素个数能检测的目标就更大。如b所示，在特征层的每个结点上都将产生4个不同大小的anchor(1:1两个，1：2两个），如c所示，在特征层上也是如此。根据真是目标矩形框与每个anchor的IOU大小计算可知，b中包含2个anchor为正样本，c中只有1个。

SSD的一些特点：

使用多尺度特征层进行检测。在Faster R-CNN的RPN中，anchor是在干网络的最后一个特征层上生成的，而在SSD中，anchor不仅是在最后一个特征层上产生的，而且在几个高层特征层处同时也在产生anchor。这些层大小依次递减，使得SSD可以检测不同尺度的目标。
SSD中所有特征层产生的anchor都将经过正负样本的筛选，然后进行分类分数以及Bbox位置的学习。即特征层上生成的正负样本将直接进行最终的分类（ClassNum个类别）以及Bbox的学习，不像Faster R-CNN那样先在第一步学习是否有物体（只有0/1两个类别）以及Bbox位置，然后在第二步学习最终的分类（ClassNum个类别）以及对Bbox位置的微调。

在实际应用时，我们不仅要关注精度，很多情况下还要考虑速度，比如对视频内容进行实时地检测，这时候我们就希望又方法很好地进行速度和精度的平衡。

版权声明：本文为CSDN博主「努力卷」的原创文章，遵循CC 4.0 BY-SA版权协议，转载请附上原文出处链接及本声明。
原文链接：https://blog.csdn.net/qq786558544/article/details/120912836