问题 sr failed: CUDA out of memory. Tried to allocate 解决

一 错误信息:sr failed: CUDA out of memory

sr failed: CUDA out of memory. Tried to allocate 370.00 MiB. GPU 0 has a total capacty of 12.00 GiB of which 8.66 GiB is free. Of the allocated memory 969.24 MiB is allocated by PyTorch, and 306.76 MiB is reserved by PyTorch but unallocated. If reserved but unallocated memory is large try setting max_split_size_mb to avoid fragmentation.  See documentation for Memory Management and PYTORCH_CUDA_ALLOC_CONF
0 Solvay_conference_1927

如下图:

二 解读错误信息 

这个报错信息表明你的CUDA程序在执行时遇到了内存不足的问题。以下是报错信息的解释:

  1. sr failed: CUDA out of memory.:CUDA是用于进行GPU加速的计算框架,这里报告了CUDA内存不足的错误。

  2. Tried to allocate 370.00 MiB.:尝试分配了370.00兆字节(MiB)的内存。

  3. GPU 0 has a total capacity of 12.00 GiB of which 8.66 GiB is free.:GPU 0的总内存容量为12.00吉字节(GiB),其中有8.66 GiB是空闲的。

  4. Of the allocated memory 969.24 MiB is allocated by PyTorch, and 306.76 MiB is reserved by PyTorch but unallocated.:已经分配的内存中,969.24 MiB被PyTorch使用,而另外的306.76 MiB被PyTorch保留但尚未分配。

  5. If reserved but unallocated memory is large try setting max_split_size_mb to avoid fragmentation.:如果保留但未分配的内存很大,可以尝试设置max_split_size_mb以避免碎片化。这是一个建议,你可以尝试调整一些相关的参数来优化内存分配。

  6. See documentation for Memory Management and PYTORCH_CUDA_ALLOC_CONF:查看内存管理和PYTORCH_CUDA_ALLOC_CONF的文档,以获取更多关于内存管理和配置的信息。

三 分析原因与解决:

提示的是与gpu内存有关,根据本机环境查看本机gpu内存,如下图:

当前的 gpu总内存总12G,只有了3.7G,还有8G左右,与上面的错误描述对得上,部分gpu内存被占用,先清找出占用gpu内存进程优化掉先。

找出占用gpu的app,如下图:

 优化掉占用gpu的app后,gpu内存占用情况如下图:

再次运行项目,这时不会出现报“sr failed: CUDA out of memory”显存不够错误 ,成功解决该问题。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/414900.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

ubuntu20.04一键通过docker-compose部署mysql 8.0.20

os:ubuntu20.04 docker:v24 docker-compose:v2.2.2 主要步骤 1.拉取镜像 docker pull mysql:8.0.20 2.创建目录 mkdir -p /data/docker_mysql/log mkdir -p /data/docker_mysql/data mkdir -p /data/docker_mysql/conf.d 3.创建配置文…

使用 TurfJS 寻找垂直线

在最近的一个项目中有个需求,我需要确定从单个点 © 到由其他两个点(A 和 B)的连线的垂直距离。通常我们可以只使用turf.nearestPointOnLine(),但是只有当C点位于前两点之间时才有效。 但是点 C 可以在任何位置,不…

axios的基础使用

在阅读本篇文章之前,可以阅读一下这篇文章 json-server的基础使用 因为我们接下来需要使用到json-server 在使用axios之前我们需要导入axios 介绍2种情况: 一、在项目中使用 我们一般都是使用以下两种方法安装 npm i axios yarn add axios二、在普通学习…

HarmonyOS—开发环境诊断的功能

为了大家开发应用/服务的良好体验,DevEco Studio提供了开发环境诊断的功能,帮助大家识别开发环境是否完备。可以在欢迎界面单击Help > Diagnose Development Environment进行诊断。如果已经打开了工程开发界面,也可以在菜单栏单击Help >…

pytest文档35-Hooks函数之统计测试结果(pytest_terminal_summary)

前言 用例执行完成后,我们希望能获取到执行的结果,这样方便我们快速统计用例的执行情况。 也可以把获取到的结果当成总结报告,发邮件的时候可以先统计测试结果,再加上html的报告。 pytest_terminal_summary 关于TerminalReport…

Linux网络文件共享服务

目录 一.文件存储类型 1.直连式存储:Direct-Attached Storage,简称DAS 2.存储区域网络:Storage Area Network,简称SAN(可以使用空间,管理也是你来管理) 3.网络附加存储:Network-…

马季徒孙李寅飞透露:央视春晚相声有岳云鹏、金霏陈曦、卢鑫玉浩

♥ 为方便您进行讨论和分享,同时也为能带给您不一样的参与感。请您在阅读本文之前,点击一下“关注”,非常感谢您的支持! 文|猴哥聊娱乐 编辑|侯欢庭 在相声界,有一位备受瞩目的小天才,他就是李寅飞。他不…

多线程排序(java版)

📑前言 本文主要是【排序】——多线程排序的文章,如果有什么需要改进的地方还请大佬指出⛺️ 🎬作者简介:大家好,我是听风与他🥇 ☁️博客首页:CSDN主页听风与他 🌄每日一句&#x…

寒假刷题-递归与递推

寒假刷题 92. 递归实现指数型枚举 解法1递归 使用递归对每一个坑位进行选择,每个坑位有两种选择,填或者不填,使用st数组来记录每个坑位的状态,u来记录已经有多少坑位有了选择。 每个坑位有2钟选择,n个坑位的复杂度就…

python脚本多个文件夹下多个文件中sql语句片段比对

一、需求: 日常测试授权脚本,需要检查多个行业文件夹下单独的授权脚本和汇总授权脚本,一个文件根目录下有多个子文件夹,子文件夹下有多个sql文件,人为比对较为耗时。 需要实现在文件中找到某个sql语句片段&#xff0c…

ChatGPT 和文心一言,各有优劣

目录 前言 具体比较 智能回复能力 语言准确性 知识库丰富度 生成内容风格 总结 前言 近年来,随着人工智能技术的不断进步,AI助手已成为人机交互的重要载体。其中代表性的两个AI助手系统分别是OpenAI推出的ChatGPT,以及腾讯研发的文心一言。这两个…

mysql 为大表新增字段或索引

1 问题 mysql 为大表增加或增加索引等操作时,直接操作原表可能会因为执行超时而导致失败。解决办法如下。 2 解决办法 (1)建新表-复制表A 的数据结构,不复制数据 create table B like A; (2)加字段或索…