简介:
YOLOv4 (2020.4.23)发布还不到 2 个月,很多人都没来及仔细看。。。突然 YOLOv5 (2020.6.10)又双叕来了。。。
YOLOv5的大小仅有 27 MB,而使用 darknet 架构的 YOLOv4 有 244 MB,对比之下小了近 90%,同时在准确度方面又与 YOLOv4 基准相当。
Github地址:https://github.com/ultralytics/yolov5
yolov5权重文件:https://pan.baidu.com/s/1Zk2Ksfl_v-apbRBQ_mqc6w
密码:00mp
作者给的算法性能如下图:
网络结构:
改编自知乎大佬的一张图:
Yolov5s网络是Yolov5系列中深度最小,特征图的宽度最小的网络。后面的3种(Yolov5m、Yolov5l、Yolov5x)都是在此基础上不断加深,不断加宽。
核心原理详解:
1、Input:
(1)Mosaic数据增强:
同Yolov4,是这个作者提出来的。
(2)自适应锚框计算:
在以前的yolo中,我们要自己用k-means聚类算出初始anchors的大小,但Yolov5中将此功能整进了train代码里,每次训练时自适应的计算不同训练集中的最佳锚框值。
(3)自适应图片缩放:
在训练阶段,比如网络输入的尺寸608×608,但我数据的尺寸是大小不一的,一般方法是直接同一缩放到标准尺寸,然后填充黑边,如下图所示:
但如果填充的比较多,则存在信息冗余,影响推理速度。
Yolov5在推理阶段,采用缩减黑边的方式,来提高推理的速度。在代码datasets.py的letterbox函数中进行了修改,对原始图像自适应的添加最少的黑边。
eg:“比如我1000×800的图片不是直接缩放到608×608的大小,而是计算608/1000=0.608 然后缩放至608×486的大小,然后计算608-486=122 然后np.mod(122,32)取余数得到26,再平均成13填充到图片高度两端,最后是608×512。”
2、Backbone:
(1)Focus结构:
Focus结构,在Yolov3&Yolov4中并没有这个结构,其中比较关键是切片操作。
以Yolov5s的结构为例,原始608×608×3的图像输入Focus结构,采用切片操作,先变成304×304×12的特征图,再经过一次32个卷积核的卷积操作,最终变成304×304×32的特征图。
(2)CSP结构:
Yolov5与Yolov4都有CSP结构,不同点在于,Yolov4中只有主干网络使用了CSP结构。
而Yolov5中设计了两种CSP结构,以Yolov5s网络为例,CSP1_X结构应用于Backbone主干网络,另一种CSP2_X结构则应用于Neck中。
3、Neck:
(1)FPN+PAN结构。
Yolov5现在的Neck和Yolov4中一样,都采用FPN+PAN的结构。
Yolov4的Neck结构中,采用的都是普通的卷积操作。而Yolov5的Neck结构中,采用借鉴CSPnet设计的CSP2结构,加强网络特征融合的能力。
4、Prediction:
(1)Bounding box损失函数:
Yolov4中采用的CIOU_Loss做Bounding box的损失函数,Yolov5中采用其中的GIOU_Loss。
ps:回归损失函数近些年的发展过程是:
Smooth L1 Loss → IoU Loss(2016)→ GIoU Loss(2019)→ DIoU Loss(2020)→ CIoU Loss(2020)
IOU_Loss:主要考虑检测框和目标框重叠面积。
GIOU_Loss:在IOU的基础上,解决边界框不重合时的问题。
DIOU_Loss:在IOU和GIOU的基础上,考虑边界框中心点距离的信息。
CIOU_Loss:在DIOU的基础上,考虑边界框宽高比的尺度信息。
(2)nms非极大值抑制:
后处理阶段一般会对很多个框进行NMS算法,因为CIOU_Loss中包含影响因子v,涉及groudtruth的信息,而测试推理时,是没有groundtruth的。
所以Yolov4推理时是在DIOU_Loss的基础上采用DIOU_nms的方式,而Yolov5中是GIOU_Loss的基础上采用加权nms的方式。
系列传送门:
目标检测——R-CNN(一)
目标检测——Fast R-CNN(二)
目标检测——Faster R-CNN(三)
目标检测——Mask R-CNN(四)
目标检测——R-FCN(五)
目标检测——YOLOv3(六)
目标检测——YOLOv4(七)
目标检测——YOLOv5(八)
目标检测——SSD(九)
目标检测——RetinaNet(十)
目标检测——RefineDet(十一)
版权声明:本文为CSDN博主「Y.Z.Y.」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/qq_42823043/article/details/108002560
暂无评论