目标检测小结(RCNN、fast RCNN、faster RCNN)

目标检测小结(RCNN、fast RCNN、faster RCNN)

RCNN

RCNN又称基于候选框的目标检测算法

主要由三步组成,生成候选区域,传入神经网络,分类

  • 生成候选区域:采用像素、色域分割图像,可以采用生成树算法,SS选着性搜索算法
  • 传入神经网络:与之前学的不同,这里的传入神经网络的目的是提取特征,而非分类。在传入前需要Warp,把图片换成统一大小。
  • 分类:使用SVM算法分类。完成后还需一小步:精修,使用SVM结合NMS获得BBOX,再使用DPM,将传入的框精修。

image-20220131001559221

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-nN6MhP4l-1643560510909)(C:\Users\23204\AppData\Roaming\Typora\typora-user-images\image-20220131001649962.png)]

image-20220131001902039
image-20220131001655129


Fast RCNN

将后两部(提取特征+分类)融合在一个模型上,精修也是

ROI pooling layer

这样提高了速率

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-vDE0ZeOD-1643560510911)(C:\Users\23204\AppData\Roaming\Typora\typora-user-images\image-20220131001924063.png)]


Faster RCNN

将候选框生成也融合进去,可以采用RPN算法,anchor.

一开始我很纳闷,为什么候选框的生成也可以融进去,后来细想也是,CNN网络主要用来分类,但CNN也可以训练生成候选框,这样通过一个神经网络可以将3步融合在一起。[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-uwKjkrhz-1643560510912)(C:\Users\23204\AppData\Roaming\Typora\typora-user-images\image-20220131002514570.png)]


制高点:[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-mqy0Ek6M-1643560510913)(C:\Users\23204\AppData\Roaming\Typora\typora-user-images\image-20220131003041855.png)]


本次笔记是在学习多目标识别理论部分做的,TWO-stage的YOLO家族和RCNN家族的代码实现会在后续更新。

第一次用markdown语法记笔记(使用表情的方法找了好久还没找到555),多有不周,感谢指正。

加油学习人,冲冲冲。

own语法记笔记(使用表情的方法找了好久还没找到555),多有不周,感谢指正。

加油学习人,冲冲冲。

感谢阅读。

版权声明:本文为CSDN博主「锡安sion」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/qq_45772960/article/details/122757567

锡安sion

我还没有学会写个人说明!

暂无评论

发表评论

相关推荐

YOLO-V3-SPP详细解析

YOLO-V3-SPP 继前两篇简单的YOLO博文 YOLO-V1 论文理解《You Only Look Once: Unified, Real-Time Object Detection》YOLO-V2论文理解《YOLO9000: Bet

YOLOv5 目标检测

前言 YOLOv5官方发布的代码中,检测网络共有四个版本,依次为YOLOv5s、YOLOv5m、YOLOv5l、YOLOv5x 。其中YOLOv5s是“深度”和“特征图宽度”均最小的网络,另外三种可以认为是在其基础上,进行了加深、加宽。 看一