首页 » 机器视觉 » 正文

《南溪的目标检测学习笔记》——训练PyTorch模型遇到显存不足的情况怎么办(“OOM: CUDA out of memory“)

2023-03-24 272 0

文章目录[隐藏]

1 前言
2 如何判断真正是出现显存溢出（不是“软件误报”）
3 如何减少PyTorch模型需要的显存
- 3.1 减小batch_size的数量

1 前言

在目标检测中，可能会遇到显存不足的情况，我们在这里记录一下解决方案；

2 如何判断真正是出现显存溢出（不是“软件误报”）

当前需要分配的显存在600MiB以下，
例如：

RuntimeError: CUDA out of memory. Tried to allocate 60.00 MiB (GPU 0; 10.76 GiB total capacity; 8.71 GiB already allocated; 59.00 MiB free; 8.81 GiB reserved in total by PyTorch) If reserved memory is >> allocated memory try setting max_split_size_mb to avoid fragmentation. See documentation for Memory Management and PYTORCH_CUDA_ALLOC_CONF

否则就是“软件误报”引起的OOM错误，则重新运行程序，错误可能就会消失；

3 如何减少PyTorch模型需要的显存

3.1 减小batch_size的数量

最小的数量可以设置为2；

版权声明：本文为CSDN博主「songyuc」的原创文章，遵循CC 4.0 BY-SA版权协议，转载请附上原文出处链接及本声明。
原文链接：https://blog.csdn.net/songyuc/article/details/121145863

songyuc

我还没有学会写个人说明！

查看作者页面

暂无评论

发表评论取消回复

要发表评论，您必须先登录。

相关推荐

目标检测标注文件yolo v5格式转coco格式详解及代码实现

机器视觉 2025-07-26

目标检测标注文件yolo v5格式转coco格式详解及代码实现

前言目标检测数据集的标注格式通常有三种格式：pascal voc、coco、yolo。因此当我们运行开源代码使之用于目标检测时，会遇到开源代码所要求的数据集和我们目前数据集格式不同的问题，修改开源代码

利用PaddleDetection部署自己的轻量级移动检测嵌入式平台（多种高性能网络模型）--Pytorch实现

机器视觉 2025-04-28

利用PaddleDetection部署自己的轻量级移动检测嵌入式平台（多种高性能网络模型）--Pytorch实现

目录文章核心： 1.效果图及视频展示 2.背景 3.安装PaddlePaddle 4.预训练模型的下载比如yolov3在coco和voc数据集上的预训练模型和权重列表如下： 5.模型导出&#xff0

YOLOX训练：显存足够，但依旧CUDA out of memory（Tried to allocate 5.58 GiB，8.00 GiB total capacity，6.40 GiB free）

机器视觉 2024-11-11

YOLOX训练：显存足够，但依旧CUDA out of memory（Tried to allocate 5.58 GiB，8.00 GiB total capacity，6.40 GiB free）

问题已经解决，请参考以下博文： https://blog.csdn.net/ELSA001/article/details/120918082?spm1001.2014.3001.5501 刚刚我尝试训练自己的yo

PyTorch实现联邦学习目标检测单阶段retinanet-csv自定义数据集 DeepLesion

机器视觉 2024-10-14

PyTorch实现联邦学习目标检测单阶段retinanet-csv自定义数据集 DeepLesion

torchvision 包含众多流行数据集和图像处理方法 Dataset类 PyTorch 读取图片，主要是通过 Dataset 类，所有的 datasets 都需要继承它要让PyTorch读取自己的数据集&