首页 » 机器视觉 » 正文

目标检测：YOLO v1算法

2024-07-18 146 0

文章目录[隐藏]

YOLO V1

YOLO V1

算法思想

将一幅图像分成s*s个网格，如果某个目标的中心落在这个网格中，则这个网络就负责预测这个目标。
每个网格要预测B个bounding box，每个bounding box除了要预测位置之外，还要附带预测一个置信度，每个网格还要预测C个类别的分数。

网络结构

YOLOv1使用了24层卷积层和2层全连接层，最后得到一个7*7*30的Tensor

输出的7*7*30中的30表示的是两个预测框的位置和置信度以及20个类别的分数，前10个表示的是两个框的中心点坐标和置信度，后20个表示的是20个类别的分数

损失函数

这四个损失都是使用的误差平方和，其中在计算宽高损失的时候先开根号后再求误差平方和，是因为当小目标和大目标的差值相同时，如果直接做差那就造成两个的损失是一样的，但现实是大目标的损失应该更小些，所以作者使用了开根号后再求误差平方和。

[公式] 与在这里插入图片描述的作用，就是让含有物体的格点，在损失函数中的权重更大，让模型更加“重视”含有物体的格点所造成的损失。在论文中，与的取值分别为5与0.5。

版权声明：本文为CSDN博主「_-CHEN-_」的原创文章，遵循CC 4.0 BY-SA版权协议，转载请附上原文出处链接及本声明。
原文链接：https://blog.csdn.net/qq_40042726/article/details/121395499

_-CHEN-_

我还没有学会写个人说明！

查看作者页面

暂无评论

发表评论取消回复

要发表评论，您必须先登录。

相关推荐

目标检测标注文件yolo v5格式转coco格式详解及代码实现

机器视觉 2025-07-26

目标检测标注文件yolo v5格式转coco格式详解及代码实现

前言目标检测数据集的标注格式通常有三种格式：pascal voc、coco、yolo。因此当我们运行开源代码使之用于目标检测时，会遇到开源代码所要求的数据集和我们目前数据集格式不同的问题，修改开源代码

YOLOV5训练自己的无人车避坑（障）系统

机器视觉 2024-04-17

YOLOV5训练自己的无人车避坑（障）系统

一、环境配置 1.安装好显卡驱动，如：CUDA； 2.配置好pytorch1.7及以上版本的python3,尽量安装GPU和CPU通用的pytorch 这部分我不详细讲述，各位哥可以

ICCV2021目标检测算法SwinT的配置（Swin Transformer: Hierarchical Vision Transformer using Shifted Windows）

机器视觉 2023-08-23

ICCV2021目标检测算法SwinT的配置（Swin Transformer: Hierarchical Vision Transformer using Shifted Windows）

1、论文下载地址： Swin Transformer: Hierarchical Vision Transformer using Shifted Windows. [paper] 2、代码下载地址： Swin

Pytorch机器学习（九）—— YOLO中对于锚框，预测框，产生候选区域及对候选区域进行标注详解

机器视觉 2023-07-15

Pytorch机器学习（九）—— YOLO中对于锚框，预测框，产生候选区域及对候选区域进行标注详解

Pytorch机器学习（九）—— YOLO中锚框，预测框，产生候选区域及对候选区域进行标注详解目录 Pytorch机器学习（九）—— YOLO中锚框&#xff