详解两阶段3D目标检测网络 Voxel R-CNN:Towards High Performance Voxel-based 3D Object Detection
本文介绍一篇两阶段的3D目标检测网络:Voxel R-CNN,论文已收录于AAAI 2021。 这里重点是理解本文提出的 Voxel RoI pooling。 论文链接为:https://arxiv.
本文介绍一篇两阶段的3D目标检测网络:Voxel R-CNN,论文已收录于AAAI 2021。 这里重点是理解本文提出的 Voxel RoI pooling。 论文链接为:https://arxiv.
1 简介目标检测中的集合预测 常见的目标检测方法如Faster-RCNN,RetinaNet等都是通过预设anchor的方式进行预测,这种方式本质上就是类似滑动窗口的一种模式。而使用这种滑动窗口的方式其实是人为地给
Y ou Only Look Once:Unified, Real-Time Object Detection YOLO,一种新的目标检测方法。 YOLO和MultiBox都使用卷积网络来预测图像中的边界框,但YOL
前言 论文地址:RetinaNet https://arxiv.org/abs/1708.02002 源码地址:见6节。(PythonCaffee2) Abstract 有最高准确率的目标检测器是基于R-CN
论文链接: https://arxiv.org/pdf/2103.10643v1.pdf. 前言 特征金字塔网络(FPN)是提取物体检测中的多尺度特征的有效框架。然而,基于FPN的方法主要遭受通道减
本文对基于激光雷达的无监督域自适应3D物体检测进行了研究,论文已收录于 ICCV2021。 在Waymo Domain Adaptation dataset上,作者发现点云质量的下降是3D物件检测器性能下降的主要原
1、backbone 是指用于在imagenet数据集上预训练的结构,用于提取图片特征。用于GPU:vgg,resnet,densenet;用于CPU:squeezeNet,mobilenet,shuffleNet
论文:Learning Spatial Fusion for Single-Shot Object Detection. Songtao Liu,Di Huang,Yunhong Wang 摘要 金字塔特征表示是解决目标检测中尺
Facebook AI 提出了 DETR,利用 Transformer 去做目标检测,该方法去除了许多目标检测中的人工设计组件,同时展现了非常好的性能。但是,DETR 存在收敛速度慢和特征
Semantic Relation Reasoning for Shot-Stable Few-Shot Object Detection 基于语义关系推理的fsod 虽然few shot的数据量很少,但是基类和novel类之间