部队内网网站建设方案,做网站成都,小程序商城怎么开通,wordpress 小工具居中在开发的过程中#xff0c;程序已经关闭#xff0c;但是GPU显存无法释放#xff0c;在使用pytorch写程序的时候, 有时候会在控制台终止掉正在运行的程序#xff0c;但是有时候程序已经结束了#xff0c;nvidia-smi也看到没有程序了#xff0c;但是GPU的内存并没有释放程序已经关闭但是GPU显存无法释放在使用pytorch写程序的时候, 有时候会在控制台终止掉正在运行的程序但是有时候程序已经结束了nvidia-smi也看到没有程序了但是GPU的内存并没有释放这是怎么回事呢
使用pytorch设置多线程threads进行数据读取DataLoader其实是假的多线程他是开了N个子进程PID都连着进行模拟多线程工作所以程序跑完或者中途kill掉主进程的话子进程的GPU显存并不会被释放需要手动一个一个kill才行。
解决办法
1、查看现象
nvidia-smi
2、查看进程
fuser -v /dev/nvidia*
3、取出PID
fuser -v /dev/nvidia*|awk -F {print $0} /tmp/pid.file
4、强制杀掉进程
while read pid ; do kill -9 $pid; done /tmp/pid.file