首页 » 机器视觉 » 正文

目标检测中的BackBone,Neck,Head

2023-08-05 367 0

文章目录[隐藏]

目标检测中的BackBone,Neck,Head

目标检测中的BackBone,Neck,Head

本博客只记录本人学习对目标检测的理解，如有不正确，烦请各位大佬指正。

基于深度学习的目标检测算法有三个组件：Backbone,Neck及Head。
首先，对于backbone，看文献或博客经常会有backbone，看翻译会译作主干，其实就是主干网络，主要用于特征提取，并且基本在大型数据集(ImageNet,COCO,VOC等)上完成训练，拥有预训练参数的卷积神经网络，例如：ResNet50，Darknet53等等。

然后Head,翻译为头，检测头，主要用于预测目标的种类的位置（bounding boxes）

在backbone和head之间，会添加一些用于收集不同阶段特征的网络层，简单理解为提取的特殊特征，称为Neck。

简而言之，基于深度学习的目标检测模型结构是这样的：输入–主干–脖子–头--输出。主干提取特征，脖子提取更复杂的特征，然后头部计算预测输出。

版权声明：本文为CSDN博主「jenny_paofu」的原创文章，遵循CC 4.0 BY-SA版权协议，转载请附上原文出处链接及本声明。
原文链接：https://blog.csdn.net/lzz555517/article/details/122416044