《南溪的目标检测学习笔记》——训练PyTorch模型遇到显存不足的情况怎么办(“OOM: CUDA out of memory“)

1 前言

在目标检测中,可能会遇到显存不足的情况,我们在这里记录一下解决方案;

2 如何判断真正是出现显存溢出(不是“软件误报”)

当前需要分配的显存在600MiB以下
例如:

RuntimeError: CUDA out of memory. Tried to allocate 60.00 MiB (GPU 0; 10.76 GiB total capacity; 8.71 GiB already allocated; 59.00 MiB free; 8.81 GiB reserved in total by PyTorch) If reserved memory is >> allocated memory try setting max_split_size_mb to avoid fragmentation. See documentation for Memory Management and PYTORCH_CUDA_ALLOC_CONF

否则就是“软件误报”引起的OOM错误,则重新运行程序,错误可能就会消失;

3 如何减少PyTorch模型需要的显存

3.1 减小batch_size的数量

最小的数量可以设置为2;

版权声明:本文为CSDN博主「songyuc」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/songyuc/article/details/121145863

songyuc

我还没有学会写个人说明!

暂无评论

发表评论

相关推荐