[疑难杂症2023-007]multiprocessing.Process使用时遇到的几个棘手问题

本文由Markdown编辑器编辑完成。

1. 背景

近日,为了解决自己负责的一个组件,在处理大量数据时,由于内存释放不及时,而导致整个组件占用了较高的内存。
这主要是因为目前我们在使用python的一个采用多进程的框架——Celery.
关于Celery的基本用法,我会在后面专门写一篇文章介绍。
由于Celery,是在设置了总的并发量的基础上,动态的创建和回收进程。有一个参数是:worker_max_tasks_per_child, 是为了设置子进程每运行多少个任务,这个子进程就会被系统回收,释放它所占的内存资源,然后再重新perfork出一个新的子进程,来继续处理任务。

当这个参数设置为1时,其实就是每执行一个任务,就回收进程,释放内存。
我所遇到的应用场景时,部分数据需要立刻释放,部分数据,可以相对将这个参数worker_max_tasks_per_child,设置得大一些。
因此,我想到了,那还不如,直接使用multiprocessing.Process(), 来解决这个问题。

因此,线上运行的基本代码,类似:

from multiprocessing import Process......
if conditionA:Process(target=funcA, args=(m,n)).start()
else:Celery_task.apply_async()

这样,就可以根据实际的情况,如果是想让程序每跑一个任务,就回收进程和释放内存,就可以走第一个if分支;如果是可以允许多运行一些任务,不要那么频繁的回收和创建子进程,就可以走else分支。

本来以为,这是一个很简单的改动,但当真正测试时,却发现了很多意想不到的问题。

问题如下:
同样的一个任务,如果运用celery的子进程跑,就可以顺利运行完毕。但是用Process().start()运行,任务在运行过程中就会中止。而且,并不会发生任何的报错。即可加try…except块包起来,也没有任何的异常抛出。

2. 解决方案

为了解决Process()内部的进程,执行任务时中断的问题,开始进行逐行debug。后来在debug的过程中,发现了几个问题,同时也向chatgpt寻求帮助,得到了一些回复。这里记录一下。

2.1 importlib的调用位置

首先发现的问题是,多进程从celery切换到Process()时,importlib的使用,会导致程序处理被中断。
importlib, 主要是为了能够动态地导入一些包。因为需要导入的包的名称,可能需要根据函数传入的参数来决定。
debug过程中发现,如果是在Process()的外部,导入相应的包时,可能导致处理中断。而,如果是在Process()的target函数内部,再import相应的模块,则可以正常的工作。
在这里插入图片描述

2.2 与pytorch的兼容问题

使用Process(), 还有可能在使用到pytorch的地方卡住。
因为,有时候为了调用深度学习模型的一些算法,会将算法封装成一个package,来供子进程的任务调用。
通过一些查询,chatgpt给出的一些解释如下:
在这里插入图片描述
对于以上提到的,与pytorch的兼容问题,前两个推荐的解决方案,是将引入multiprocessing.Process()的地方,修改为引入:
torch.multiprocessing来代替。因为这个torch中的multiprocessing, 通过共享内存的方式,已经解决了:python的GIL锁,和不同进程各自复制一份数据时,内存占用过大的问题;
第3个方案,则是在启用多进程的时候,设置一下调用的方法:

torch.multiprocessing.set_start_method('spawn')

这样可以保证每个进程,都会拥有独立的GPU资源。

以上,是这段时间,因为想当然的使用多进程中的Process()时,与原来的代码的一些兼容问题。
为了定位和解决这些问题,也耗费了挺长的时间。

看来,为了如果对于某些东西,一知半解时,最好不要贸然使用。否则,有可能处理它引发的问题的时间,都大于了它带来的收益。因此,必须知己知彼,方能百战不殆。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/55270.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

SpringIoc-个人学习笔记

Spring的Ioc、DI、AOP思想 Ioc Ioc思想:Inversion of Control,控制反转,在创建Bean的权利反转给第三方 DI DI思想:Dependency Injection,依赖注入,强调Bean之间的关系,这种关系由第三方负责去设…

《吐血整理》进阶系列教程-拿捏Fiddler抓包教程(20)-Fiddler精选插件扩展安装让你的Fiddler开挂到你怀疑人生

1.简介 Fiddler本身的功能其实也已经很强大了,但是Fiddler官方还有很多其他扩展插件功能,可以更好地辅助Fiddler去帮助用户去开发、测试和管理项目上的任务。Fiddler已有的功能已经够我们日常工作中使用了,为了更好的扩展Fiddler&#xff0c…

PostMan调用metersphere接口 ,copy完事~

获取token接口: http://192.****:8081/signin ,接下来就可以调用其他功能的接口了 例:创建账户,将获取到的access_token放置在接口请求的token中 其他接口调用同上

K8s中的Secret

Secret作用:加密数据存在etcd里面,让pod容器以挂载Volume方式进行访问。场景:凭据

K8S系列文章 之 容器存储基础 Volume

Volume Volume是容器数据卷。我们经常创建删除一些容器,但有时候需要保留容器中的一些数据,这时候就用到了Volume。它也是容器之间数据共享的技术,可以将容器中产生的数据同步到本地。实际就是把容器中的目录挂载到运行着容器的服务器或个人…

git报错:Error merging: refusing to merge unrelated histories

碰对了情人,相思一辈子。 打命令:git pull origin master --allow-unrelated-histories 然后等一会 再push 切记不要有冲突的代码 需要改掉~

零代码爬虫平台SpiderFlow的安装

什么是 Spider Flow ? Spider Flow 是一个高度灵活可配置的爬虫平台,用户无需编写代码,以流程图的方式,即可实现爬虫。该工具支持多数据源、自动保存至数据库、任务监控、抓取 JS 动态渲染页面、插件扩展(OCR 识别、邮…

【IMX6ULL驱动开发学习】22.IMX6ULL开发板读取ADC(以MQ-135为例)

IMX6ULL一共有两个ADC&#xff0c;每个ADC都有八个通道&#xff0c;但他们共用一个ADC控制器 1.设备树 在imx6ull.dtsi文件中已经帮我们定义好了adc1的节点部分信息 adc1: adc02198000 {compatible "fsl,imx6ul-adc", "fsl,vf610-adc";reg <0x0219…

【性能测试】关于系统用户数,并发用户数,在线用户数,吞吐量

目录 1、概念 系统用户数 在线用户数 并发用户数 计算公式 2、吞吐量 资料获取方法 1、概念 系统用户数 狭义上来说&#xff0c;可以理解为系统注册用户数&#xff1b;广义上来说&#xff0c;可以理解为所有访问过系统的用户数 在线用户数 狭义上来说&#xff0c;可以…

无涯教程-Lua - Arrays(数组)

数组是对象的有序排列&#xff0c;可以是包含行集合的一维数组&#xff0c;也可以是包含多行和多列的多维数组。 在Lua中&#xff0c;数组是使用带有整数的索引表实现的。数组的大小不是固定的&#xff0c;并且可以根据无涯教程的要求(取决于内存限制)来增长。 一维数组 一维…

6.6.tensorRT高级(1)-mmdetection框架下yolox模型导出并推理

目录 前言1. yolox导出2. yolox推理3. 补充知识3.1 知识点3.2 mmdetection 总结 前言 杜老师推出的 tensorRT从零起步高性能部署 课程&#xff0c;之前有看过一遍&#xff0c;但是没有做笔记&#xff0c;很多东西也忘了。这次重新撸一遍&#xff0c;顺便记记笔记。 本次课程学习…

vue 前端页面开发经验记录

本博文记录了在vue项目开发中的一些经验&#xff0c;具体包含&#xff1a;class动态绑定、子页面刷新、注入函数到子页面、数据加载效果、单击后编辑、文件上传、数据分页、表单提交等的使用记录。 1、class动态绑定 根据变量的值绑定不同的class样式&#xff0c;这里ftype的…