复现YOLOv5或使用YOLOv5训练自己的数据集,亲测有效

创建环境

使用ptyhon3.7版本

ptyorch的安装

yolov5最新版本需要pytorch1.6版本以上,使用以下代码进行环境的安装:

pip install torch==1.7.0+cu101 torchvision==0.8.1+cu101 torchaudio===0.7.0 -f https://download.pytorch.org/whl/torch_stable.html

下载源码和安装所需要的库

源码地址:https://github.com/ultralytics/yolov5

在anaconda中进入项目的路径
cd 目录

然后安装项目所依赖的库

pip install -r requirements.txt

数据集的准备

由于YOLOv5对于标签只识别txt的文件,所以在使用labelimg进行标注时需要把生成的xml文件转换为txt文件。有的标注工具标签是json格式的,需要先把json转换成xml再转换成txt文件才可以

创建文件夹

自己先创建一个VOCCDATA文件夹里,里面包含images、Annotations和ImageSets子文件夹,再在ImageSets里创建main文件夹,main文件夹里包含train.txt和test.txt文件(txt文件都是空的)。
在这里插入图片描述
在这里插入图片描述在这里插入图片描述

数据集的处理

先对数据集的划分

import os
import random
 
trainval_percent = 0.2   #可自行进行调节
train_percent = 1
xmlfilepath = 'VOCCData/Annotations'  #自己的路径
txtsavepath = 'VOCCData/ImageSets/Main'    #自己的路径
total_xml = os.listdir(xmlfilepath)
 
num = len(total_xml)
list = range(num)
tv = int(num * trainval_percent)
tr = int(tv * train_percent)
trainval = random.sample(list, tv)
train = random.sample(trainval, tr)
 
#ftrainval = open('VOCCData/ImageSets/Main/trainval.txt', 'w')
ftest = open('VOCCData/ImageSets/Main/test.txt', 'w')   #自己的路径
ftrain = open('VOCCData/ImageSets/Main/train.txt', 'w')   #自己的路径
#fval = open('VOCCData/ImageSets/Main/val.txt', 'w')
 
for i in list:
    name = total_xml[i][:-4] + '\n'
    if i in trainval:
        #ftrainval.write(name)
        if i in train:
            ftest.write(name)
        #else:
            #fval.write(name)
    else:
        ftrain.write(name)
 
#ftrainval.close()
ftrain.close()
#fval.close()
ftest.close()

这样,train.txt和test.txt里就会有我们划分好的数据

接下来把xml文件转换为txt文件

import xml.etree.ElementTree as ET
import pickle
import os
from os import listdir, getcwd
from os.path import join
 
sets = ['train', 'test']
 
classes = ['bird','cat']  #自己训练的类别,引号之间用逗号隔开
 
def convert(size, box):
    dw = 1. / size[0]
    dh = 1. / size[1]
    x = (box[0] + box[1]) / 2.0
    y = (box[2] + box[3]) / 2.0
    w = box[1] - box[0]
    h = box[3] - box[2]
    x = x * dw
    w = w * dw
    y = y * dh
    h = h * dh
    return (x, y, w, h)
 
def convert_annotation(image_id):
    in_file = open('VOCCData/Annotations/%s.xml' % (image_id))  #自己的路径
    out_file = open('VOCCData/labels/%s.txt' % (image_id), 'w')  #自己的路径
    tree = ET.parse(in_file)
    root = tree.getroot()
    size = root.find('size')
    w = int(size.find('width').text)
    h = int(size.find('height').text)
 
    for obj in root.iter('object'):
        difficult = obj.find('difficult').text
        cls = obj.find('name').text
        if cls not in classes or int(difficult) == 1:
            continue
        cls_id = classes.index(cls)
        xmlbox = obj.find('bndbox')
        b = (float(xmlbox.find('xmin').text), float(xmlbox.find('xmax').text), float(xmlbox.find('ymin').text),
             float(xmlbox.find('ymax').text))
        bb = convert((w, h), b)
        out_file.write(str(cls_id) + " " + " ".join([str(a) for a in bb]) + '\n')
 
wd = getcwd()
for image_set in sets:
    if not os.path.exists('VOCCData/labels/'):   #自己的路径
        os.makedirs('VOCCData/labels/')   #自己的路径
    image_ids = open('VOCCData/ImageSets/Main/%s.txt' %   (image_set)).read().strip().split()   #自己的路径
    list_file = open('VOCCData/%s.txt' % (image_set), 'w')   #自己的路径
    for image_id in image_ids:
        list_file.write('VOCCData/images/%s.jpg\n' % (image_id))  #自己的路径
        convert_annotation(image_id)
    list_file.close()

转换好之后的文件如下:
在这里插入图片描述

代码其余需要修改的部分

在data文件夹下创建myvoc.yaml文件:
在这里插入图片描述
myvoc.yaml内容如下:

train: VOCCData/train.txt
val: VOCCData/val.txt

#number of classes
nc: 2

#class names
names: ["bird", "cat"]

下载预训练权重

网址为:
github.com/ultralytics/yolov5/releases
有多个与训练模型,找自己合适的

修改model文件夹中对应的与训练模型的yaml文件中的类别数
在这里插入图片描述
修改number of classes改为你自己的类别数

开始训练

使用以下命令开始训练

python train.py --img 640 --batch 4 --epoch 300 --data ./data/myvoc.yaml --cfg ./models/yolov5m.yaml --weights weights/yolov5m.pt --workers 0

训练时会在runs文件夹中生成模型和相应的图片
在这里插入图片描述

版权声明:本文为CSDN博主「white_zhz」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/qq_41319665/article/details/113506955

white_zhz

我还没有学会写个人说明!

暂无评论

发表评论

相关推荐

anchor自适应锚框计算

自适应锚框计算 预定义边框就是一组预设的边框,在训练时,以真实的边框位置相对于预设边框的偏移来构建(也就是我们打下的标签) 训练样本。 这就相当于,预设边框先大致在可能的

yolov5安装

一、准备 YOLOv5环境要求Python版本大于等于3.7以及PyTorch大于等于1.7 PyTorch安装请移步 二、安装 # Clone the repository git clone https://github.com/ult