『玩转Streamlit』--集成定时任务

news/2025/1/9 13:53:00/文章来源:https://www.cnblogs.com/wang_yb/p/18662015

学习了Streamlit了之后,可以尝试给自己的命令行小工具加一个简单的界面。

本篇总结了我改造自己的数据采集的工具时的一些经验。

1. 概要

与常规的程序相比,数据采集任务的特点很明显,比如它一般都是I/O密集型程序,涉及大量网络请求或文件读写,耗费的时间比较长;而且往往是按照一定的时间间隔周期性地执行。

这样的程序对交互性要求不高,所以我之前都是用命令行的方式来实现的。

命令行虽然完成采集的任务没有问题,但是采集程序多了之后,管理起来不太方便,

比如,需要查看某个采集程序的配置,或是查看采集程序的状态时,需要登录服务器的命令行页面去查看。

于是,自然就想到使用Streamlit来构造一个简单的界面,本来采集程序也是用Python编写的,

Streamlit集成非常方便。

下面主要使用Streamlit完成以下功能:

  1. 启动定时任务
  2. 停止定时任务
  3. 查看任务状态

2. 实现示例

数据集采集任务都是耗时比较长的,在命令行中无所谓,把定时任务放在一个无限循环中,

不断的去执行就行了。停止采集只要中断命令行(比如Ctrl+C)就行。

但是,在Streamlit中,不能被采集任务阻塞住页面,所以要用多线程或多进程的方式来启动。

因为不同的采集程序是独立的,所以下面的示例采用多进程的方式。

同时,通过Streamlitsession_state来存储采集程序的状态,从而实现控制采集程序启停的功能。

大致的结构如下:

具体代码如下,其中的采集程序是模拟的,主要是为了展示如何通过Streamlit App来控制其他任务的执行。

import streamlit as st
import pandas as pd
import multiprocessing
import timeif "status01" not in st.session_state:st.session_state.status01 = Falseif "status02" not in st.session_state:st.session_state.status02 = Falsedef spider01():"""模拟数据采集01"""while True:print("数据采集01...")time.sleep(3)def spider02():"""模拟数据采集02"""while True:print("数据采集02...")time.sleep(3)st.title("采集管理")spider_data = pd.DataFrame({"ID": [1, 2],"名称": ["采集01", "采集02"],"状态": [False, False],}
)spiders = st.data_editor(spider_data,width=500,num_rows="dynamic",disabled=["ID", "名称"],
)status01 = spiders.iloc[0, 2]
status02 = spiders.iloc[1, 2]if status01 != st.session_state.status01:if status01:  # 启动print("启动采集01")spider01_proc = multiprocessing.Process(target=spider01)spider01_proc.daemon = Truespider01_proc.start()st.session_state.proc01 = spider01_procelse:print("停止采集01")st.session_state.proc01.terminate()st.session_state.proc01.join()st.session_state.status01 = status01if status02 != st.session_state.status02:if status02:  # 启动print("启动采集02")spider02_proc = multiprocessing.Process(target=spider02)spider02_proc.daemon = Truespider02_proc.start()st.session_state.proc02 = spider02_procelse:print("停止采集02")st.session_state.proc02.terminate()st.session_state.proc02.join()st.session_state.status02 = status02

通过勾选状态列的Checkbox来控制采集程序的启停,运行的日志如下:

$  streamlit run .\app.pyYou can now view your Streamlit app in your browser.Local URL: http://localhost:8501Network URL: http://192.168.0.6:8501启动采集01
数据采集01...
数据采集01...
启动采集02
数据采集01...
数据采集02...
数据采集01...
数据采集02...
数据采集01...
数据采集02...
停止采集02
数据采集01...
停止采集01

3. 总结

通过Streamlit,可以快速的提供一个简单易用的数据采集控制界面。

上面使用sesstion来管理状态其实不太合理(重新打开浏览器session会丢失),使用sqlite之类的持久存储来保存更好。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/866544.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

VUE +WebSocket+speak-tt 实现在浏览器右下角实时给商家推送订单消息

先看效果 1、WebSocket服务建立1.1 引入包<dependency><groupId>org.springframework.boot</groupId><artifactId>spring-boot-starter-websocket</artifactId></dependency>1.2 新建配置类package com.ruoyi.web.core.config;import org.…

ASE65R180-ASEMI超洁MOS管ASE65R180

ASE65R180-ASEMI超洁MOS管ASE65R180编辑:ll ASE65R180-ASEMI超洁MOS管ASE65R180 型号:ASE100N10 品牌:ASEMI 封装:TO-220F 批号:最新 最大漏源电流:21A 漏源击穿电压:650V RDS(ON)Max:180mΩ 引脚数量:3 芯片个数: 沟道类型:P沟道MOS管、超洁MOS管 漏电流:ua 特性…

【搜索】DFS与BFS

99. 岛屿数量讲解:https://programmercarl.com/kamacoder/0099.岛屿的数量广搜.html#思路 DFS代码 #include <iostream> #include <cstring>using namespace std;const int N = 55;int n, m; int g[N][N]; bool st[N][N]; int dx[4] = {-1, 0, 1, 0}, dy[4] = {0,…

DFS与BFS专题

99. 岛屿数量讲解:https://programmercarl.com/kamacoder/0099.岛屿的数量广搜.html#思路 DFS代码 #include <iostream> #include <cstring>using namespace std;const int N = 55;int n, m; int g[N][N]; bool st[N][N]; int dx[4] = {-1, 0, 1, 0}, dy[4] = {0,…

Spinnaker

Spinnaker 是一个持续交付平台,它定位于将产品快速且持续的部署到多种云平台上。 Spinnaker 主要特性:配置一次,随时运行;随地部署,集中化管理;开源。 Spinnaker 组件:Spinnaker 最初是以实现内部的端到端持续交付为目标,作为 Asgard 的替代,该项目期望重建一个持续交…

Java基础学习(五)

Java基础学习(五):数组 目录Java基础学习(五):数组概念声明与创建初始化基本特点内存分析应用多维数组扩展内容Arrays 类冒泡排序稀疏数组 本文为个人学习记录,内容学习自 狂神说Java概念数组是相同类型数据的有序集合 每个数据称为一个数组元素,可以通过下标来访问声明…

CDS标准视图:付款锁定原因 I_PaymentBlockingReason

视图名称:付款锁定原因 I_PaymentBlockingReason 视图类型:基础视图 视图代码:点击查看代码 //Documentation about annotations can be found at http://help.sap.com searching for CDS annotations //Inserted by VDM CDS Suite Plugin @ObjectModel.usageType.sizeCateg…

欧拉OpenEuler使用nfs和rsync复制文件夹到新服务器.250109

案例: 服务器A是新服务器 服务器B为老服务器 需要将服务器B的/data/storage ,拷贝到服务器A的 /home/sync-data下一、服务器A 新服务器配置nfs 1. 安装nfs systemctl stop firewalld df -h mkdir -p /home/sync-datayum install nfs-utils systemctl status nfs-se…

在 .NET 9 中使用 Scalar 替代 Swagger

前言 在.NET 9发布以后ASP.NET Core官方团队发布公告已经将Swashbuckle.AspNetCore(一个为ASP.NET Core API提供Swagger工具的项目)从ASP.NET Core Web API模板中移除,这意味着以后我们创建Web API项目的时候不会再自动生成Swagger API文档了。那么今天咱们一起来试试把我们…

第九章 范围管理 (2025年详细解析版)

目录什么是范围管理?9.1 管理基础9.1.1 产品范围和项目范围9.1.2 产品范围和项目范围管理新实践9.2 项目范围管理过程9.2.1 过程概述9.2.2 项目范围管理过程9.2.3 裁剪考虑因素(了解)9.2.4 敏捷与适应方法总结9.3 规划范围管理1. 课程目标2. 过程定义:规划范围管…

Qt监控系统远程网络登录/请求设备列表/服务器查看实时流/回放视频/验证码请求

一、前言说明 这几个功能是近期定制的功能,也非常具有代表性,核心就是之前登录和设备信息都是在本地,存放在数据库中,数据库可以是本地或者远程的,现在需要改成通过网络API请求的方式,现在很多的服务器很强大,都提供了各种API接口,包括登录和拉取回放等,相当于直接对接…

debian10测试

https://help.aliyun.com/zh/ecs/user-guide/change-debian-9-or-10-repository-addresses?spm=a2c4g.11186623.0.0.52c44bccrP9uFq