Towards Open Vocabulary Object Detection without Human-provided Bounding Boxes(2021CVPR)----论文阅读笔记
Abstract 简单来说: 实现了无需人工提供边界框标注OVD检测框架 如何实现:预先训练的 vision-language 模型的 localization 能力和 生成可直接用于训练目标检测的伪边界框标签来实现
Abstract 简单来说: 实现了无需人工提供边界框标注OVD检测框架 如何实现:预先训练的 vision-language 模型的 localization 能力和 生成可直接用于训练目标检测的伪边界框标签来实现
paper code https://github.com/alirezazareian/ovr-cnn 1. Abstract 目标检测现存的问题? 学习更多的对象类别通常需要更多的边框注释。 比如:目标检测从600类扩