Python被远程主机强制关闭后怎么自动重新运行进程

news/2024/9/12 11:54:44/文章来源:https://www.cnblogs.com/TS86/p/18372679

要实现Python程序在被远程主机强制关闭后能够自动重新运行,我们可以采用几种方法,但最直接且常用的方法之一是结合操作系统级的工具或脚本。在Linux系统中,我们可以使用cron作业或者systemd服务来实现这一功能;在Windows系统中,可以使用任务计划程序。但在这里,为了提供一个跨平台的、更灵活的解决方案,我们可以编写一个简单的Python脚本来监控主程序,并在检测到主程序被关闭后重新启动它。

1.使用了Python的subprocess模块来启动和监控主程序示例

1.1脚本的示例

以下是一个Python脚本的示例,该脚本将监控另一个Python程序(例如main_program.py)的运行状态,并在它退出时重新启动它。这个监控脚本使用了Python的subprocess模块来启动和监控主程序,以及time.sleep来周期性检查主程序是否还在运行。

import subprocess  
import time  def run_main_program():  # 启动主程序  print("Starting main_program.py...")  try:  # 使用subprocess.Popen启动主程序,确保可以捕获其PID  process = subprocess.Popen(['python', 'main_program.py'])  # 等待主程序结束  process.wait()  print("main_program.py has exited. Restarting...")  except Exception as e:  print(f"An error occurred: {e}. Trying to restart main_program.py...")  if __name__ == "__main__":  while True:  run_main_program()  # 等待一段时间后再重新启动(例如每5分钟)  time.sleep(300)  # 300秒 = 5分钟  # 注意:我们需要将'main_program.py'替换为我们的主程序文件名。  
# 此外,请确保这个监控脚本和主程序在同一个目录下,或者提供完整的路径给subprocess.Popen。

1.2说明

(1)主程序文件:我们需要将main_program.py替换为我们希望监控并自动重启的Python程序文件名。

(2)错误处理:上述脚本包含了基本的错误处理,以便在主程序启动失败时能够输出错误信息并尝试重新启动。

(3)重启间隔time.sleep(300)设置了重启之间的等待时间为5分钟。我们可以根据需要调整这个值。

(4)跨平台兼容性:这个脚本在Linux和Windows上都应该能够工作,只要Python环境已经设置好,并且main_program.py是可执行的。

1.3注意

(1)如果主程序是因为异常或错误而频繁退出,仅仅通过重启可能不是解决问题的最佳方法。在这种情况下,我们应该首先调查并修复主程序中的错误。

(2)这个脚本以无限循环的方式运行,直到我们手动停止它。在生产环境中,我们可能希望使用更健壮的服务管理工具(如systemd或Windows服务)来管理它。

对于需要更高级的解决方案来应对Python程序被远程主机强制关闭后自动重新运行进程的问题,我们可以考虑使用守护进程管理工具如supervisor,或者编写更复杂的重试逻辑结合异常处理。以下将详细介绍这两种方法:

2.使用supervisor工具

supervisor是一个用Python编写的守护进程管理工具,它可以监控我们的应用程序,并在崩溃或异常退出时自动重启应用程序。这种方法适用于生产环境,因为它提供了更稳定和可靠的监控与重启机制。

步骤:

(1)安装supervisor
在命令行中运行以下命令来安装supervisor(以Linux为例):

sudo apt-get install supervisor  # Debian/Ubuntu  
sudo yum install supervisor      # CentOS/RHEL

(2)配置supervisor
创建一个配置文件(例如myapp.conf),并在其中指定要监控的Python应用程序的详细信息。配置文件通常位于/etc/supervisor/conf.d/目录下。配置文件的示例如下:

[program:myapp]  
command = python /path/to/your/app.py  
directory = /path/to/your/app  
user = your_username  
autostart = true  
autorestart = true  
startsecs = 5  
stopwaitsecs = 600  
environment = ENV_VAR_1=value, ENV_VAR_2=value

根据我们的应用程序的实际路径和需要设置相应的值。

(3)启动supervisor
运行以下命令来启动supervisor并重新读取配置文件:

sudo supervisorctl reread  
sudo supervisorctl update

(4)监控和管理应用程序
使用以下命令来监控和管理由supervisor管理的应用程序:

sudo supervisorctl status  
sudo supervisorctl tail -f myapp  
sudo supervisorctl restart myapp  
sudo supervisorctl stop myapp

3.编写复杂的重试逻辑结合异常处理

如果我们不想使用额外的工具,可以在Python脚本中编写更复杂的重试逻辑和异常处理机制。这种方法更加灵活,但可能需要更多的代码和逻辑来确保稳定性和可靠性。

示例代码:

import time  
import random  def remote_task():  """模拟与远程主机的交互,可能因连接关闭而抛出异常"""  # 随机模拟成功与失败  if random.choice([True, False]):  print("任务执行成功")  else:  raise ConnectionError("与远程主机连接失败")  def run_task():  max_retries = 5  # 最大重试次数  retry_interval = 5  # 重试间隔(秒)  retries = 0  while retries < max_retries:  try:  remote_task()  break  # 成功后跳出循环  except ConnectionError as e:  print(e)  print(f"正在尝试重新连接...(剩余重试次数:{max_retries - retries - 1})")  time.sleep(retry_interval)  retries += 1  if retries == max_retries:  print("达到最大重试次数,任务执行失败。")  if __name__ == "__main__":  run_task()

在这个示例中,我们定义了一个remote_task函数来模拟与远程主机的交互,并可能抛出ConnectionError异常。run_task函数则负责在一个循环中运行remote_task,并在捕获到ConnectionError时根据设定的最大重试次数和重试间隔进行重试。

总结

对于需要更高级解决方案的场景,推荐使用supervisor等守护进程管理工具,因为它们提供了更稳定和可靠的监控与重启机制。然而,如果我们希望在不引入额外工具的情况下实现类似功能,编写复杂的重试逻辑和异常处理机制也是一个可行的选择。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/785108.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

第17章_反射机制

该篇笔记,是因为想重新学一下Spring Cloud 和Spring Cloud Alibaba框架,但是b站尚硅谷的最新课程,使用SpringBoot3作为,单体服务的框架,而SpringBoot3最低要求JDK17,所以必须要学一下JDK8-JDK17之间的新特性。本来只想看,宋红康老师课程的第18章JDK8-17新特性,但是觉得…

qt静态编译 全自动编译qt静态库 qt5 windows安装qt (2024.2.23)

全自动编译qt5静态库(2024.2.23) 本教程是从无到有配置qt.io和vcpkg实现全自动编译qt5的静态库,使得您可以静态编译qt项目 0. 安装Visual Studio 2022 这个我就不多解释了,直接去官网下载社区版本,勾选使用C++的桌面开发安装好就行 1. 安装qt.io的开发环境 1.1 下载在线安装…

【python】面向对象之类成员(字段,方法)

1.类的成员可以分为三大类:字段、方法和属性注:所有成员中,只有普通字段的内容保存对象中,即:根据此类创建了多少对象,在内存中就有多少个普通字段。而其他的成员,则都是保存在类中,即:无论对象的多少,在内存中只创建一份。2.字段字段包括:普通字段和静态字段,他们…

2024.8.21

DATE #:20240821 ITEM #:DOC WEEK #:WEDNESDAY DAIL #:捌月拾捌TAGS< BGM = "琴师--要不要买菜" > < theme = oi-contest > < [NULL] > < [空] > < [空] >``` 此情可待成追忆,只是当时已惘然 -- 《锦瑟》 李商隐 ```T1 试卷答案(ex…

回溯part011

今天学习了回溯算法:基本知识,关键是那个模板 组合问题:画树状图+简单的剪枝 电话号码的组合问题,和经典组合问题的差别在于取不同集合中的组合,注意如何有限制的在for循环之前确定循环哪个数组,通过树状图确定for循环中i的大小。1. 基本知识回溯法也可以叫做回溯搜索法,…

『模拟赛』暑假集训CSP提高模拟26

『模拟赛记录』暑假集训CSP提高模拟26Rank 打得一般,倒数第二场了。。A. 博弈 直接搬了牛客的一套题。 一眼没思路,模了一会放弃直接去打 T2 了,后来把 \(\mathcal{O(n^2)}\) 暴力 打了拿 30pts。 正解用到了异或哈希。首先确定合法的数量即为总对数 \(\frac{n(n-1)}{2}\) 减…

java变量定义与数据类型

变量:在java程序运行过程中,其值可以发送改变的量 定义变量的语句格式: 数据类型 变量名 = 初始化值; 使用变量的注意事项: 1、使用基本数据类型的变量,实际上使用的是变量中存储的值 2、在同一作用域(同一个大括号)中,变量名不能重复 3、变量名是区分大小写的 4、java…

040、Vue3+TypeScript基础,使用nanoid库生成id

01、使用powershell,输入npm i nanoid来安装: 02、App.vue代码如下:<template><div class="app"><h2 class="title">App.Vue</h2><Page1/><br><Page2/></div> </template><script lang="…

2024.8.21 鲜花

太水了,但还是有重点的Never Gonna Give You Up Were no strangers to love You know the rules and so do I A full commitments what Im thinking of You wouldnt get this from any other guy I just wanna tell you how Im feeling Gotta make you understand Never gonna…

AI大模型应用

参考文档https://creative.chat/1.调用AI大模型API 1.1文心一言 https://console.bce.baidu.com/qianfan/ais/console/applicationConsole/application创建应用:https://console.bce.baidu.com/qianfan/ais/console/applicationConsole/application 示例代码:https://console…

【Azure Redis】AKS中使用Lettuce连接Redis Cache出现 timed out 问题的解决思路

问题描述 使用 Lettuce 客户端,在AKS环境中连接Azure Redis服务,出现超时错误。 错误消息: Redis command timed out , command timed out after 1 minute(s). 错误截图: 解决思路 当出现Redis客户端连接不上时,需要先排查Redis服务器的状态,比如Server Load是否处于高…