基于Pytorch中的Dataset和Dataloader读取Voc类目标检测数据集

记录一下使用Dataset和Dataloader读取诸如VOC类目标检测数据集的方法。
目标检测任务核心两点:
1,找到图片中目标的具体位置,使用框标记出来。
2,对找到的目标的种类进行识别。
所以需要读取的数据主要也为两种数据:图片,目标位置信息及种类,而第二类信息一般为.xml文件格式进行存储。
代码实现:

import torch
from torch.utils.data import Datasets, DataLoader
import numpy as np
import cv2  # 使用PIL进行图片处理也可以
import xml.etree.ElementTree as ET #  用来解析.xml文件

#  存储Voc数据集中的类别标签的字典 没打全
Voc_label = {'aeroplane', 'bycycle', 'bird','boat','bottle','...'}

dict_labels = dict(zip(Voc_label, range(len(Voc_label))))

class Read_data(Datasets):
	def __init__(self, root_path):
		super(Read_data).__init()__
		self.root_path = root_path
		
		self.img_idx = []
		self.anno_idx = []
		self.bbox = []
		self.obj_name = []
		train_txt_path = self.root_path + "/ImageSets/存放用于Training 的图片的名称的txt文件"
		self.img_path = self.root + "/JPEGImage/存放.jpg图片的地址"
		self.anno_path = self.root + "/Annotations/存放annotation标注.xml文件的地址"
        train_txt = open(train_txt_path)
        lines = train_txt.readlnes()
		for l in lines:
			name = line.strip().split()[0]
			self.img_idx.append(self.img_path + name+ '.jpg')
			self.ano_idx.append(self.ano_path+ name + '.xml')
	def __getitem__(self, item):
		img = cv2.imread(self.img_idx[item])
		height, width, channels = img.shape
		targets = ET.parse(self.ano_idx[item])
		res = [] #存储标注信息 即边框左上角和右下角的四个点的坐标信息和目标的类别标签
		for obj n targets.iter('object'):
			name = obj.find('name').text.lower().strip()
			class_idx = dict_classes[name]
			bbox = obj.find('bndbox')
			pts = ['xmin', 'ymin', 'xmax', 'ymax']
			obj_bbox = []
			for i, pt in enumerate(pts):
				cur_pt = int(bbox.find(pt))
				cur_pt = cur_pt/ width if i% 2 ==0 else cur_pt / height # 将坐标做一个线性变换
				obj_bbox.append(cur_pt)
			res.append(obj_bbox)
			res.append(class_idx)
		return img, res
	
	def __length__(self):
		data_length = len(self.img_idx)
		return data_lenth

#  开始调用 Read_data类读取数据,并使用Dataloader生成迭代数据为送入模型中做准备
Voc_data_path = ' Voc数据集地址'
train_data = Read_data(root_path = Voc_data_path)
train_loader = DataLoader(train_data, batch_size = 5, shuffle = False)

#  可以这样理解:自己定义的Read_data负读取数据,而DataLoader负责按照定义的batch_size指派Read_data去读取
#指定数目的数据,然后再进行相应的拼接等其它内部操作。
	 



版权声明:本文为CSDN博主「米斯特鱼」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/weixin_43679674/article/details/122734939

米斯特鱼

我还没有学会写个人说明!

暂无评论

发表评论

相关推荐

yolov5 检测一类物体

使用yolov5官方框架检测一类物体 yolov5的官方框架可较好的对共80种类进行目标检测,本文介绍一种直接修改源代码来只检测一类物体的方法以及通用的方法(利用数据集训练自己的权重)。 一、直接修

深度学习之目标检测YOLOv5

一.简介 YOLOV4出现之后不久,YOLOv5横空出世。YOLOv5在YOLOv4算法的基础上做了进一步的改进,检测性能得到进一步的提升。虽然YOLOv5算法并没有与YOLOv4算法进行性能比较与分析&#xff0