HRNet(v1,v2,v2p)论文语义分割笔记及代码简读(Deep high-resolution representation learning for visual recognition )
原文:Deep high-resolution representation learning for visual recognition
论文链接: https://arxiv.org/abs/1908.07919v2
p
原文:Deep high-resolution representation learning for visual recognition
论文链接: https://arxiv.org/abs/1908.07919v2
p
本文介绍一篇两阶段的3D目标检测网络:Voxel R-CNN,论文已收录于AAAI 2021。 这里重点是理解本文提出的 Voxel RoI pooling。
论文链接为:https://arxiv.
1 简介目标检测中的集合预测
常见的目标检测方法如Faster-RCNN,RetinaNet等都是通过预设anchor的方式进行预测,这种方式本质上就是类似滑动窗口的一种模式。而使用这种滑动窗口的方式其实是人为地给
Y ou Only Look Once:Unified, Real-Time Object Detection YOLO,一种新的目标检测方法。 YOLO和MultiBox都使用卷积网络来预测图像中的边界框,但YOL
前言
论文地址:RetinaNet https://arxiv.org/abs/1708.02002
源码地址:见6节。(PythonCaffee2)
Abstract
有最高准确率的目标检测器是基于R-CN
论文链接: https://arxiv.org/pdf/2103.10643v1.pdf.
前言
特征金字塔网络(FPN)是提取物体检测中的多尺度特征的有效框架。然而,基于FPN的方法主要遭受通道减
本文对基于激光雷达的无监督域自适应3D物体检测进行了研究,论文已收录于 ICCV2021。
在Waymo Domain Adaptation dataset上,作者发现点云质量的下降是3D物件检测器性能下降的主要原
1、backbone 是指用于在imagenet数据集上预训练的结构,用于提取图片特征。用于GPU:vgg,resnet,densenet;用于CPU:squeezeNet,mobilenet,shuffleNet
论文:Learning Spatial Fusion for Single-Shot Object Detection. Songtao Liu,Di Huang,Yunhong Wang 摘要
金字塔特征表示是解决目标检测中尺
Facebook AI 提出了 DETR,利用 Transformer 去做目标检测,该方法去除了许多目标检测中的人工设计组件,同时展现了非常好的性能。但是,DETR 存在收敛速度慢和特征