Faster R-CNN

分配策略：

计算anchor与ground truth之间的IoU，IoU>fg_thres(0.7)作为正样本，IoU<bg_thres(0.3)作为负样本，IoU在bg_thres~fg_thres(0.3~0.7)之间作为ignore样本(不参与训练)。

存在问题：

①IoU不能代表anchor的定位能力，IoU在0.3以下的anchor也可能被回归到0.7以上；

②IoU为0.95和0.75的anchor有优劣之分，但一刀砍策略无法体现它们的区别；

③anchor是预定义的，所以无法保证每个ground truth都能匹配很好的anchor，导致不同ground truth分配到的anchor不均衡。

TopK

用于解决问题③

分配策略：对每个ground truth，找到与它IoU为TopK的anchor作为正样本；可以看作通过动态改变IoU阈值来划分正负样本，同时保证不同大小的目标都能得到一定数量的anchor进行训练。

Learning from Noisy Anchor

用于解决问题②

核心思想：提出一个评价anchor质量的指标cleanliness，根据回归后IoU以及分类置信度得出，用于判断一个正anchor是否是noisy的。

分配策略：cleanliness可以代替0/1作为分类标签加入focal loss，同时还作为权重加权回归，即质量好的anchor多回归，质量不好(noisy)的anchor少回归。

HAMBox

用于解决问题①

核心思想：提出一种anchor补偿策略，动态地把那些本身和ground truth重叠度不高但回归结果很好的anchor设为正样本。

分配策略：与TopK类似，在训练中对每个ground truth动态地补偿k个anchor作为正样本，这些anchor根据回归结果好坏选出。

ATSS

从统计意义上思考正负样本的定义，把每个ground truth周围的anchor与它的IoU进行统计可以形成一个分布，通过取这个分布上的某个分位数来决定每个ground truth的IoU阈值。

OneNet

现有的one-stage检测器的label assign都只用到了位置信息(location)，但目标检测是分类(classification)和定位(location)的联合任务，只考虑位置信息的label assign和网络的优化目标存在着非常大的misalignment，导致冗余的高分检测框，从而需要NMS后处理。

作者提出了OneNet，首次实现了end-to-end dense detector without NMS。OneNet的样本匹配策略是Minimum Cost Assign：cost定义为样本与ground truth的分类距离(classification cost)和位置距离(location cost)之和，正样本是所有样本中和ground truth的cost最小的样本，其他都是负样本。

作者解读：ICML2021: OneNet - 知乎

代码：GitHub - PeizeSun/OneNet: What Makes for End-to-End Object Detection, ICML2021

E2E with FCN

受到DETR的启发，作者设计了一种prediction-aware one-to-one assignment方法。此外，作者还提出了3D Max Filtering以增强feature的local表征能力，并提出用one-to-many auxiliary loss加速收敛。

提出了一个cost：

提出了一种POTO策略：

对网络输出的prob(代表分类)和IoU(代表回归)做加权几何平均，再加一个空间先验。但其性能依旧不能匹敌one-to-many+NMS，问题在于：①one-to-one需要网络输出的feature非常sharp，对CNN要求严苛；②one-to-many有更强的监督和更快的收敛速度。作者分别用3D Max Filtering和one-to-many auxiliary loss缓解上述问题。

作者解读：丢弃Transformer，FCN也可以实现E2E检测 - 知乎

代码：https://github.com/Megvii-BaseDetection/DeFCN