首页 » 机器视觉 » 正文

Yolo家族算法分析

2024-06-08 223 0

文章目录[隐藏]

1 历史简介
2 YOLO算法思想
3 YOLO家族

1 历史简介

在这里插入图片描述

2 YOLO算法思想

在这里插入图片描述
YOLO算法的基本思想：
（1）将图片划分为

S

×

S

S \times S

$S \times S$ 个网格；
（2）计算每个边界框和置信度；
（3）计算每个网格属于某个类别的概率；
（4）根据上述的计算结果来获得最终的目标检测。
在这里插入图片描述
（1）计算每个边界框的坐标

t

x

,

t

y

,

t

w

,

t

h

t_x, t_y, t_w, t_h

$t_{x}, t_{y}, t_{w}, t_{h}$ ；
（2）计算每个边界框的目标性得分；
（3）计算每个边界框的类别得分；
（4）上述计算构成一个边界框的属性；
（5）再将多个

B

B

$B$ 边界框的这些属性进行多尺度融合。
在这里插入图片描述

3 YOLO家族

3.1 Yolo v1

3.2 Yolo v2

3.3 Yolo v3

在这里插入图片描述

3.4 Yolo v4

在这里插入图片描述
Yolo v4在Yolo v3的基础上做了如下改进：

输入端采用mosaic数据增强
Backbone上采用了CSPDarknet53、Mish激活函数、Dropblock等方式。（cspnet减少了计算量的同时可以保证准确率）
Mish函数为
$\text { Mish }=x * \tanh \left(\ln \left(1+e^{x}\right)\right) Mish =x∗tanh(ln(1+ex)) 橙色曲线为： ln ⁡ ( 1 + e x ) \ln(1+e^{x}) ln(1+ex) 蓝色曲线为：Mish函数为什么采用mish函数？可能也是最重要的，目前的想法是，平滑的激活函数允许更好的信息深入神经网络，从而得到更好的准确性和泛化。$
Neck中采用了SPP、FPN+PAN的结构
输出端采用CIOU_Loss、DIOU_nms操作。

3.5 Yolo v5

在这里插入图片描述
算法性能测试图：

Yolov5s网络最小，速度最少，AP精度也最低，训练后的模型十几M大小，速度很快，可用于嵌入式设备。Yolov5m、Yolov5I和Yolov5x在此基础上，不断加深加宽网络，AP精度也不断提升。

版权声明：本文为CSDN博主「HenrySmale」的原创文章，遵循CC 4.0 BY-SA版权协议，转载请附上原文出处链接及本声明。
原文链接：https://blog.csdn.net/search_129_hr/article/details/121756657

HenrySmale

我还没有学会写个人说明！

查看作者页面

暂无评论

发表评论取消回复

要发表评论，您必须先登录。

相关推荐

机器视觉 2025-07-08

树莓派实现人脸检测

准备工作先在树莓派上下载好OpenCV3版本可参考我的上一篇文章。安装openCV 实现阶段 1.人脸检测和数据收集 2.训练识别器 3.人脸识别一、人脸检测 1.下载分类器直接下载xml文件 OpenCV 也包含很多预训

机器视觉 2025-06-14

轻量级高精度人脸检测推荐

目录 yolov5_face nanodet blazeface scrfd yolov5_face yolov5 face 使用踩坑记录_jacke121的专栏-CSDN博客 nanodet 没写精度，有模型： https:/

使用OpenCV，Haar级联检测器进行面部、眼睛、嘴部检测

机器视觉 2024-11-09

使用OpenCV，Haar级联检测器进行面部、眼睛、嘴部检测

这篇博客将介绍如何使用预训练好的OpenCV Haar级联人脸、眼睛、嘴部检测器，并将它们应用于图片及实时视频流的检测。人脸检测结果是最稳定和准确的。不幸的是，在许多情况下，眼睛检测和嘴巴检测结果是

yolov5+arcface实现人脸检测和人脸识别

机器视觉 2024-09-24

yolov5+arcface实现人脸检测和人脸识别

简介最近也是刚入门深度学习，看了一些书，但是看完好像有和没看差不多，懂了但没完全懂。所以打算自己手把手做个实践项目巩固下书上学到的东西，也是好久没打代码，多动动手还是挺好