文章目录[隐藏]
目标检测中的BackBone,Neck,Head
本博客只记录本人学习对目标检测的理解,如有不正确,烦请各位大佬指正。
基于深度学习的目标检测算法有三个组件:Backbone,Neck及Head。
首先,对于backbone,看文献或博客经常会有backbone,看翻译会译作主干,其实就是主干网络,主要用于特征提取,并且基本在大型数据集(ImageNet,COCO,VOC等)上完成训练,拥有预训练参数的卷积神经网络,例如:ResNet50,Darknet53等等。
然后Head,翻译为头,检测头,主要用于预测目标的种类的位置(bounding boxes)
在backbone和head之间,会添加一些用于收集不同阶段特征的网络层,简单理解为提取的特殊特征,称为Neck。
简而言之,基于深度学习的目标检测模型结构是这样的:输入–主干–脖子–头--输出。主干提取特征,脖子提取更复杂的特征,然后头部计算预测输出。
版权声明:本文为CSDN博主「jenny_paofu」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/lzz555517/article/details/122416044
暂无评论