Attribute-aware Pedestrian Detection in a Crow

APD,citypersons的SOTA,主要解决重叠目标的问题


普通NMS流程:
对于最后输出的所有框
(1)找到预测置信度最大的框M
(2)计算其他同类框和M的IOU
(3)将IOU大于阈值N_t的框的置信度置0
普通NMS的问题
两(多)个同类物体的IOU特别大的时候,其中一个人的预测框会在最后被NMS掉
在这里插入图片描述

那么,有没有可能知道两个框是否属于同一个identity呢?

=》给每个框预测一个属性向量,负责标记其identity
如果是属于同一个identity,则其向量相近,若不属于同一个identity,则其向量尽量远离

版权声明:本文为CSDN博主「Rainylt」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/lt1103725556/article/details/121294652

Rainylt

我还没有学会写个人说明!

暂无评论

发表评论

相关推荐

Yolo系列学习笔记

Yolov1:2015/6/8 无anchor; 分成77 49个区域,每个区域预测2个bbox,输出7730( 25 20 )特征层。 使用IOU做confidence&#xff1b

CVPR2021: Sparse R-CNN新的目标检测模型

今天我们将讨论由四个机构的研究人员提出的一种方法,其中一个是字节跳动人工智能实验室。他们为我们提供了一种新的方法,称为稀疏R-CNN(不要与 Sparse R-CNN 混淆,后者在 3D 计算机视觉任务

实战深度学习目标检测:RCNN (1)

深度学习目标检测:RCNN 什么是目标检测?目标检测主要是明确从图中看到了什么物体?他们在什么位置。传统的目标检测方法一般分为三个阶段:首先在给定的图像上选择一些候选的区域&#xff0c