文章目录[隐藏]
-
目标检测定义
在图片中对可变数量的目标进行查找和分类
-
目标检测存在的三个难点
目标种类与数量问题(人群的稠密与稀疏)
目标尺度问题(行人远近的问题)
外界环境干扰问题(光照的变化,遮挡,图像的质量)
行人的移动
-
目标检测 vs 图像分类
目标检测:用不同的矩形框选出不同的物体,矩形框上的数字代表该物体的可信度。
图像分类:把相同的图片分成不同的类别。
- 目标检测,图像处理是计算机视觉基础的内容,后续会有目标跟踪,譬如:多目标跟踪,单目标跟踪等。
- 目标分割
1 semantic segmentation 语义分割,同类用相同颜色处理。
2 instance segmentation 实例分割,同类别也划分不同实例。
3 二者都要在像素层面给出结果。
目标检测的变迁
传统目标检测局限性:
- 设计特征很难设计,设计的特征存在各种各样的问题。
- 效率存在瓶颈
- 通过滑动窗口的方式提取目标框,费时。
算法的基本流程
传统目标检测算法vs深度学习目标检测算法
传统目标检测算法综述
输入:待检测的图片
候选框:滑动窗口
特征提取:计算机视觉+模式识别 特征分为三个层次,底层特征:颜色,纹理。中层特征:基于底层特征,pca特征,lda特征。高层次特征:基于底层、中层特征,是否带帽子,是否戴眼镜。
V-J 检测算法
主要用于人脸识别
Haar特征提取
训练人脸分类器(Adaboost算法)
滑动窗口
Hog+SVM 检测算法(行人检测,Opencv实现)
Hog特征提取
Svm分类器
滑动窗口选取
DPM算法
Hog的拓展
利用SVM训练得到物体的梯度
NMS(Non-maximum-suppression)
目的:为了消除冗余的框,找到最佳物体的检测位置
思想:选取那些邻域里分数最高的窗口,同事抑制分数低的窗口
版权声明:本文为CSDN博主「你的笑很夕阳」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/m0_61928877/article/details/121434713
暂无评论