yolox 训练问题记录

如果是训练自己的数据,建议按以下几步检查一下问题:

  1. pull最新的代码,我们已经在coco数据集上完整验证过,所以还有问题的话可以排除训练代码的问题;
  2. 检测你的数据集和标注,可视化gt、对其coco或者voc的格式等等;
  3. 一定记得加载预训练好的COCO权重;
  4. 观察training loss,同时修改eval_interval=1,每个epoch都评测一次。如果training loss还是在10以上徘徊,建议返回第2步再看看(COCO数据集上前3个epoch之后total loss能降到7~8左右,如果你的数据集类别低于80类,loss只会更低)
  5. 如果AP还有明显的先升后降这种形式,可以考虑调小lr,调小max_epoch等等 (特别是如果你的数据集只有几百张图,那还是别训300 epoch了吧)

一、模型训练参数修改

1、修改yolox_base.py

self.num_classes = 15                                                           self.input_size = (416,416)                                             self.train_ann = 'voc.json'#"instances_train2017.json"
self.val_ann = 'voc.json'#"instances_val2017.json"

2、yolox/data/datasets/coco.py

注意图片路径及图片后缀,修改为自己图片的路径:

img_file = os.path.join(
    #self.data_dir, self.name, "{:012}".format(id_) + ".jpg"
    self.data_dir, self.name, 'test', imgname
)

二、报错:

1、训练10个epoch后,eval出现’yolox.core.trainer:after_train:186 - Training of experiment is done and the best AP is 0.00‘问题。

     原因:验证代码没有正常运行,我的问题是验证集路径错误,软链接失效,导致无法读取验证集文件。为了快速验证训练、验证数据的准确型,可以在yolox_base.py文件将self.eval_interval参数置为1,训练1个epoch后进行验证。

三、yolo格式训练数据训练yolox

https://github.com/sunanlin13174/YOLOX-train-your-data

版权声明:本文为CSDN博主「花花花哇_」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/sinat_39307513/article/details/119533436

花花花哇_

我还没有学会写个人说明!

暂无评论

发表评论

相关推荐

YOLOX笔记

目录 1. 样本匹配 正负样本划分过程 2. yoloxwarmcos 学习率 3. 无法开启多gpu训练, 或者多gpu训练卡住? 1. 样本匹配 正负样本划分过程 说明: gt_centerbbox是在gt_bbox中心点向四周

Yolo标准数据集格式转Voc数据集

Yolo数据集格式 yolo格式详解: 1代表类别,后面小数依次是目标框x中心点坐标归一化处理,y中心点坐标归一化处理,目标框宽和高进行归一化处理(这里的归一化是按照图片的宽高进行计算的&