文章目录[隐藏]
作者丨小马
编辑丨极市平台
本文原创首发于极市平台公众号,转载请获得授权并标明出处。
【写在前面】
在本文中,作者提出了一种基于Transformer的目标检测器。在以前基于Transformer的检测器中,目标的查询是一组可学习的embedding。然而,每个可学习的embedding都没有明确的意义 (因为是随机初始化的),所以也不能解释它最终将集中在哪里。此外,由于每个对象查询将不会关注特定的区域,所以训练时优化也是比较困难的 。
为了解决这些问题,作者借鉴了CNN目标检测器中的Anchor Point机制,使得每个查询都基于特定的Anchor Point的。因此,每个查询都可以集中在Anchor Point附近的目标上。此外,本文的查询设计可以在一个位置预测多个目标。为了降低attention的计算成本,作者设计了一种轻量级的attention变体。基于新的查询设计和attention变体,本文提出的Anchor DETR可以获得比DETR更好的性能和更快的运行速度。
1. 论文和代码地址
Anchor DETR: Query Design for Transformer-Based Detector
论文地址:https://arxiv.org/abs/2109.07107
代码地址:https://github.com/megvii-model/AnchorDETR(即将开源)
原文地址:多快好省的目标检测器来了!旷视孙剑团队提出 Anchor DETR:基于 Anchor Point 的 DETR
版权声明:本文为CSDN博主「极市平台」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/Extremevision/article/details/121417096
暂无评论