AMiner推荐论文：A Normalized Gaussian Wasserstein Distance for Tiny Object Detection

论文链接： https://www.aminer.cn/pub/6178c43b5244ab9dcbb2b674?f=cs
小目标在许多现实世界的应用中无处不在，包括驾驶辅助、大规模监控和海上救援。尽管由于深度神经网络的发展，目标检测取得了显著的进展，但大多数都是用于检测正常大小的目标。而小目标(AI-TOD数据集中小于像素)往往表现出极其有限的外观信息，增加了识别特征的学习难度，导致小目标检测失败的案例非常多。
小目标检测(TOD)的研究进展主要集中在改进特征识别方面。为了提高小目标和相应特征的分辨率，对输入图像的尺度进行了归一化处理。而生成对抗网络(Generative Adversarial Network, GAN)则被提出直接生成小目标的超分辨表示。此外，提出了特征金字塔网络(Feature Pyramid Network, FPN)来学习多尺度特征，实现尺度不变检测器。事实上，现有的方法在一定程度上提高了TOD的性能，但提高精度通常也带来了额外的计算成本。
除了学习可判别特征外，训练样本选择的质量对于基于Anchor的小目标检测器来说也很重要，其中正/负标签的分配至关重要。然而，对于小目标，少量像素的属性会增加训练样本选择的难度。从图1可以看出，IoU对不同尺度的物体的敏感性差异很大。
具体来说，对于像素的小目标，轻微的位置偏差会导致明显的IoU下降(从0.53下降到0.06)，导致标签分配不准确。然而，对于像素的正常目标，IoU略有变化(从0.90到0.65)，位置偏差相同。此外，图2给出了4条不同目标尺度的IoU-Deviation曲线，随着目标尺度的减小，曲线下降速度更快。值得注意的是，IoU的敏感性来自于BBox位置只能离散变化的特殊性。
AMiner,让AI帮你理解科学！https://www.aminer.cn
在这里插入图片描述