【经典论文解读】YOLO 目标检测

前言

YOLO是一种目标检测方法,它的输入是整张图片,当检测到目标物体时用边界框圈起来,同时给该目标物体一个类别;边界框由中心位置、宽、高等来表示的;它的输出是n个物体的检测信息,每个物体的信息包括:中心位置(x,y)、高(h)、宽(w)、类别。

YOLO的全称是you only look once,指只需要浏览一次就可以识别出图中的物体的类别和位置;它是通过归回的方式计算和优化边界框和类别。

论文地址:You Only Look Once: Unified, Real-Time Object Detection

开源代码:https://github.com/pjreddie/darknet

一、思路流程

  1. 输入一张图像,把图像划分为7*7的网格;此时图像由49个网格组成的。
  2. 对于每个网络,模型都预测2个边界框;每个边界框包含的信息:置信度、中心坐标、宽、高等。此时图像有7*7*2 = 98个边界框。
  3. 设置一个阈值,去除“置信度”过低的边界框;然后通过非极大值抑制来去除冗余的边界框。

二、网络结构

 YOLO的结构比较简单,常规的卷积、池化最后加了两层全连接。画了一个草图,便于大家理解: 

版权声明:本文为CSDN博主「一颗小树x」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/qq_41204464/article/details/119276735

一颗小树x

我还没有学会写个人说明!

暂无评论

发表评论

相关推荐

【经典论文解读】YOLOv4 目标检测

前言
YOLO是一种目标检测方法,它的输入是整张图片,输出是n个物体的检测信息,可以识别出图中的物体的类别和位置。YOLOv4是在YOLOv3的基础上增加了很多实用的技巧,使得速度与精度

小目标检测方法介绍

目标检测发展很快,但对于小目标 的检测还是有一定的瓶颈,特别是大分辨率图像小目标检测 。比如79202160,甚至1600016000的图像,还有一些遥感图像 。 图像的分辨率很大&#xf

Yolo(3)(项目)Yolo v3 目标检测(85分类)

目录
基础理论
一、 读取文件
二、神经网络初始化 1、搭建神经网络
2、GPU加速
三、打开摄像头、按帧读取图像
四、向神经网络输入
五、获取神经网络输出
1、获取各层名称
2、获取输出层名称
3、获取输出层图像&#xff

YOLOV2论文详解

本文主要介绍了YOLOV2的Better和Faster部分 1. Better
YOLOV1存在如下两个缺点:
定位误差大与基于region proposal的方法相比,召回率低
因此,我们集中提