目标检测小结(RCNN、fast RCNN、faster RCNN)
RCNN
RCNN又称基于候选框的目标检测算法
主要由三步组成,生成候选区域,传入神经网络,分类
- 生成候选区域:采用像素、色域分割图像,可以采用生成树算法,SS选着性搜索算法
- 传入神经网络:与之前学的不同,这里的传入神经网络的目的是提取特征,而非分类。在传入前需要Warp,把图片换成统一大小。
- 分类:使用SVM算法分类。完成后还需一小步:精修,使用SVM结合NMS获得BBOX,再使用DPM,将传入的框精修。
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-nN6MhP4l-1643560510909)(C:\Users\23204\AppData\Roaming\Typora\typora-user-images\image-20220131001649962.png)]
Fast RCNN
将后两部(提取特征+分类)融合在一个模型上,精修也是
ROI pooling layer
这样提高了速率
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-vDE0ZeOD-1643560510911)(C:\Users\23204\AppData\Roaming\Typora\typora-user-images\image-20220131001924063.png)]
Faster RCNN
将候选框生成也融合进去,可以采用RPN算法,anchor.
一开始我很纳闷,为什么候选框的生成也可以融进去,后来细想也是,CNN网络主要用来分类,但CNN也可以训练生成候选框,这样通过一个神经网络可以将3步融合在一起。[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-uwKjkrhz-1643560510912)(C:\Users\23204\AppData\Roaming\Typora\typora-user-images\image-20220131002514570.png)]
制高点:[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-mqy0Ek6M-1643560510913)(C:\Users\23204\AppData\Roaming\Typora\typora-user-images\image-20220131003041855.png)]
本次笔记是在学习多目标识别理论部分做的,TWO-stage的YOLO家族和RCNN家族的代码实现会在后续更新。
第一次用markdown语法记笔记(使用表情的方法找了好久还没找到555),多有不周,感谢指正。
加油学习人,冲冲冲。
own语法记笔记(使用表情的方法找了好久还没找到555),多有不周,感谢指正。
加油学习人,冲冲冲。
感谢阅读。
版权声明:本文为CSDN博主「锡安sion」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/qq_45772960/article/details/122757567
暂无评论