卷积层上应用滑动窗口(目标检测篇)

1.遍历送入

利用滑动窗口进行目标检测时,低级做法是:滑动一下窗口,送入CNN执行一次分类,再滑一下,再分类

在这里插入图片描述

  • 假设输入CNN的图片为14x14x3,测试图片为16x16x3。
    那就需要移动窗口(窗口大小:14x14x3),得到4个14x14x3的图片, 分别将其输入CNN,得到4个结果。

2.一次性送入图片到网络中

那我们可不可以一次性送入整张图片,直接得到所有滑动窗口的结果呢?将后面的FC全部转成卷积层

在这里插入图片描述
在这里插入图片描述

  • 但是你会发现有很多卷积操作是重复的,其实我们可以将整张16x16x3的图输入CNN,如上图所示,最后得出4个小方块,其实每个小方块对刚好就是对应的一个滑动窗口的预测结果

版权声明:本文为CSDN博主「ToolMan萤火虫」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/weixin_47397155/article/details/122698638

ToolMan萤火虫

我还没有学会写个人说明!

暂无评论

发表评论

相关推荐

【模型压缩】Yolov3目标检测模型蒸馏实验

PaddleDetection知识蒸馏 知识蒸馏主要是让让新模型(通常是一个参数量更少的模型)近似原模型(模型即函数)。注意到,在机器学习中,我们常常假定输入到输出有一个潜在的函数关系,这个函数是未知的:从头学习一个新模型就是从有限的数据中近

深度学习_目标检测_“YOLOv5”详解(持续更新)

我最近对很火的元宇宙及其衍生概念进行了思考,虽然现在谈元宇宙落地还为时尚早,但是根据这个愿景反推回来很多的技术趋势和未来的发展方向还是值得关注的。下面是我的公众号原文:【AI行业进展研究与商业价值分析】