Box坐标转换

文章目录[隐藏]

[x, y, width, height]--在我们的训练数据集中就是这种情况(也叫COCO格式)。
[x1, y1, x2, y2] - 我们在BBox增强阶段创建的格式化版本,也叫[xmin, ymin, xmax, ymax]。这个格式在SSD/RCNN/Fast RCNN/Faster RCNN模型中使用。
[x_center, y_center, width, height] - 这是YOLO格式,或者说是使用YOLO模型训练时使用的格式。x_center, y_center是边界框中心的标准化坐标,width, height是图像的标准化宽度和高度。

Example1:

annotations 数据格式:[{'x': 641, 'y': 634, 'width': 74, 'height': 71}]

变成coco_bbox [[641, 634, 74, 71]]

数据处理:

train_df["coco_bbox"] = train_df["annotations"].apply(lambda annot: [list(item.values()) for item in eval(annot)])

版权声明:本文为CSDN博主「苏坡爱豆的笑容都没你的甜」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/weixin_44656422/article/details/122961815

我还没有学会写个人说明!

暂无评论

发表评论

相关推荐

分享 | 物体检测和数据集

因为最近学习任务比较紧(但也不妨碍元旦摆烂三天),所以中间有几个实战Kaggle比赛就跳过了,等以后有时间再回头来看看。物体检测和数据集这一节花了有一天的时间,一直有一个bug困扰,后来改了代码把box

目标检测——yolov3论文精读

📝论文下载 Abstract(摘要) YOLOv3在YOLO的基础上做了一些更新,重点在于提升检测的精度。当图片的分辨率为320 × 320,YOLOv3只使用了22 ms进行检测, m