yolox 训练问题记录

如果是训练自己的数据,建议按以下几步检查一下问题:

  1. pull最新的代码,我们已经在coco数据集上完整验证过,所以还有问题的话可以排除训练代码的问题;
  2. 检测你的数据集和标注,可视化gt、对其coco或者voc的格式等等;
  3. 一定记得加载预训练好的COCO权重;
  4. 观察training loss,同时修改eval_interval=1,每个epoch都评测一次。如果training loss还是在10以上徘徊,建议返回第2步再看看(COCO数据集上前3个epoch之后total loss能降到7~8左右,如果你的数据集类别低于80类,loss只会更低)
  5. 如果AP还有明显的先升后降这种形式,可以考虑调小lr,调小max_epoch等等 (特别是如果你的数据集只有几百张图,那还是别训300 epoch了吧)

一、模型训练参数修改

1、修改yolox_base.py

self.num_classes = 15                                                           self.input_size = (416,416)                                             self.train_ann = 'voc.json'#"instances_train2017.json"
self.val_ann = 'voc.json'#"instances_val2017.json"

2、yolox/data/datasets/coco.py

注意图片路径及图片后缀,修改为自己图片的路径:

img_file = os.path.join(
    #self.data_dir, self.name, "{:012}".format(id_) + ".jpg"
    self.data_dir, self.name, 'test', imgname
)

二、报错:

1、训练10个epoch后,eval出现’yolox.core.trainer:after_train:186 - Training of experiment is done and the best AP is 0.00‘问题。

     原因:验证代码没有正常运行,我的问题是验证集路径错误,软链接失效,导致无法读取验证集文件。为了快速验证训练、验证数据的准确型,可以在yolox_base.py文件将self.eval_interval参数置为1,训练1个epoch后进行验证。

三、yolo格式训练数据训练yolox

https://github.com/sunanlin13174/YOLOX-train-your-data

版权声明:本文为CSDN博主「花花花哇_」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/sinat_39307513/article/details/119533436

花花花哇_

我还没有学会写个人说明!

暂无评论

发表评论

相关推荐

Day 14 - 安装与执行 YOLO

Day 14 - 安装与执行 YOLO 在 介绍影像辨识的处理流程 - Day 10 有提到 YOLO 模型是由 Joseph Redmon 所提出,而到了 YOLOV4 后才换成另外一群人继续发展,

目标检测自动标注生成xml文件

前言 在训练目标检测时,标注数据是一项简单而又浪费时间的事情,如果能够自动标注数据将可以高效的扩充数据集,从而提高训练模型的效果。 目前能想到的一种自动标注方法是先训练一个检测效果较好的模型&#xff

Yolo v5 训练自己的数据集

Yolo v5 训练自己的数据集 前言 感谢各位大佬尤其是,博主:深度学习菜鸟,参考原文链接https://blog.csdn.net/qq_36756866/article/details/109