首页 > 脚本专栏 > python > CUDA out of memory的解决

关于CUDA out of memory的解决方案

2023-02-03 14:53:32 作者：萝卜牛腩

这篇文章主要介绍了关于CUDA out of memory的解决方案，具有很好的参考价值，希望对大家有所帮助。如有错误或未考虑完全的地方，望不吝赐教

1 问题描述

很多时候，我们在开始进行深度学习训练的时候，经常出现存储不够的信息，

诸如这样：

你可能会认为是自己的显卡显存不够，那就再掏钱去买个更大的显卡吧。

我的显卡是titan xp 12g显存。

其实对于绝大多数的网络都是够用的，那么这个问题该如何解决哪？

我的显卡是titan xp12g显存，举个例子我在训练模型时，设置的batch_size==16,也就是说，我可以同时处理16副图，我占用的显存是5.82个g，如果你的显存比我的小，或者你处理其他的图片占用的更大，那么，怎

么办哪？

你可以：

修改：batch_size==4

请尽量还是选用2的n次方来设置参数。这是深度学习二进制的本质。

修改后，你的显存占用会从5.82g降到0.81g，就算你的显存比较小，总有一天，你会满足自己的需求。

我使用的是2017年的thinkpad x1carobon笔记本，外界显卡坞带titan xp显卡。

我的cpu是i7-7600，已经过了几年了，并不好，但说不定你比我的cpu更差，那么怎么办哪？

你可以：

修改：workers==1

很多模型训练的时候，默认的线程也就是workers==8，也许你的cpu无法承受8线程同时训练，那么你可以把这个并行线程数降下来，例如我上面的，将线程数降为1，那么又可以愉快的玩耍了，但是，你能承受本来我有i7的cpu，本来我有12g的显存，却不能完全使用，还要承受八倍奉还么！！

这个发现，我尚未在其他csdn的博客上见到过，或者我没搜到。

应该有很多像我一样的偏执狂。天天盯着存储看，c盘没多一点点，就开始删除垃圾，删除缓存，删除windows更新备份，删除windows注销文件（2个g），删除windows系统补丁，删除c盘之外其他盘的虚拟内存，后者把虚拟内存转移到其他盘！因为，我们的c盘真的不堪重负。。。

后面有时间，我再谈谈如何给c盘自由加容吧。

可能，就像我一样，我举个例子，我把项目放在了F盘，那么我把除c盘之外，其他盘的虚拟缓存给删掉了，导致F盘的虚拟内存为0，也会出现这个问题。

那么，该怎么办哪？

你可以：

修改：我的电脑——属性——高级系统设置——设置——虚拟内存

为了跟我的显存保持一致，我就把虚拟内存也设置为12g吧应该是1024x12.。

懒得修改了，一切OK!

以上为个人经验，希望能给大家一个参考，也希望大家多多支持脚本之家。