服务重启了，如何保证线程池中的数据不丢失？-编程知识

服务重启了，如何保证线程池中的数据不丢失？

news/2025/3/8 22:54:14/文章来源:https://www.cnblogs.com/12lisu/p/18388411

大家好，我是苏三，又跟大家见面了。

前言

最近有位小伙伴在我的技术群里，问了我一个问题：服务down机了，线程池中如何保证不丢失数据？

这个问题挺有意思的，今天通过这篇文章，拿出来跟大家一起探讨一下。

1 什么是线程池？

之前没有线程池的时候，我们在代码中，创建一个线程有两种方式：

继承Thread类
实现Runnable接口

虽说通过这两种方式创建一个线程，非常方便。

但也带来了下面的问题：

创建和销毁一个线程，都是比较耗时，频繁的创建和销毁线程，非常影响系统的性能。
无限制的创建线程，会导致内存不足。
有新任务过来时，必须要先创建好线程才能执行，不能直接复用线程。

为了解决上面的这些问题，Java中引入了：线程池。

它相当于一个存放线程的池子。

使用线程池带来了下面3个好处：

降低资源消耗。通过重复利用已创建的线程降低线程创建和销毁造成的消耗。
提高响应速度。当任务到达时，可以直接使用已有空闲的线程，不需要的等到线程创建就能立即执行。
提高线程的可管理性。线程是稀缺资源，如果无限制的创建，不仅会消耗系统资源，还会降低系统的稳定性。而如果我们使用线程池，可以对线程进行统一的分配、管理和监控。

2 线程池原理

先看看线程池的构造器：

public ThreadPoolExecutor(
    int corePoolSize,
    int maximumPoolSize,
    long keepAliveTime,
    TimeUnit unit,
    BlockingQueue<Runnable> workQueue,
    ThreadFactory threadFactory,
    RejectedExecutionHandler handler)

corePoolSize：核心线程数，线程池维护的最少线程数。
maximumPoolSize：最大线程数，线程池允许创建的最大线程数。
keepAliveTime：线程存活时间，当线程数超过核心线程数时，多余的空闲线程的存活时间。
unit：时间单位。
workQueue：任务队列，用于保存等待执行的任务。
threadFactory：线程工厂，用于创建新线程。
handler：拒绝策略，当任务无法执行时的处理策略。

线程池的核心流程图如下：

线程池的工作过程如下：

线程池初始化：根据corePoolSize初始化核心线程。
任务提交：当任务提交到线程池时，根据当前线程数判断：

若当前线程数小于corePoolSize，创建新的线程执行任务。
若当前线程数大于或等于corePoolSize，任务被加入workQueue队列。

任务处理：当有空闲线程时，从workQueue中取出任务执行。
线程扩展：若队列已满且当前线程数小于maximumPoolSize，创建新的线程处理任务。
线程回收：当线程空闲时间超过keepAliveTime，多余的线程会被回收，直到线程数不超过corePoolSize。
拒绝策略：若队列已满且当前线程数达到maximumPoolSize，则根据拒绝策略处理新任务。

说白了在线程池中，多余的任务会被放到workQueue任务队列中。

这个任务队列的数据保存在内存中。

这样就会出现一些问题。

接下来，看看线程池有哪些问题。

3 线程池有哪些问题？

在JDK中为了方便大家创建线程池，专门提供了Executors这个工具类。

3.1 队列过大

Executors.newFixedThreadPool，它可以创建固定线程数量的线程池，任务队列使用的是LinkedBlockingQueue，默认最大容量是Integer.MAX_VALUE。

public static ExecutorService newFixedThreadPool(int nThreads, ThreadFactory threadFactory) {
    return new ThreadPoolExecutor(nThreads, 
                               nThreads,
                                     0L, 
                  TimeUnit.MILLISECONDS,
     new LinkedBlockingQueue<Runnable>(),
                          threadFactory);
}

如果向newFixedThreadPool线程池中提交的任务太多，可能会导致LinkedBlockingQueue非常大，从而出现OOM问题。

3.2 线程太多

Executors.newCachedThreadPool，它可以创建可缓冲的线程池，最大线程数量是Integer.MAX_VALUE，任务队列使用的是SynchronousQueue。

public static ExecutorService newCachedThreadPool() {
  return new ThreadPoolExecutor(0, 
                Integer.MAX_VALUE,
                               60L, 
                  TimeUnit.SECONDS,
    new SynchronousQueue<Runnable>());
}

如果向newCachedThreadPool线程池中提交的任务太多，可能会导致创建大量的线程，也会出现OOM问题。

3.3 数据丢失

如果线程池在执行过程中，服务突然被重启了，可能会导致线程池中的数据丢失。

上面的OOM问题，我们在日常开发中，可以通过自定义线程池的方式解决。

比如创建这样的线程池：

new ThreadPoolExecutor(8, 
                       10,
                       30L, 
     TimeUnit.MILLISECONDS,
    new ArrayBlockingQueue<Runnable>(300),
            threadFactory);

自定义了一个最大线程数量和任务队列都在可控范围内线程池。

这样做基本上不会出现OOM问题。

但线程池的数据丢失问题，光靠自身的功能很难解决。

4 如何保证数据不丢失？

线程池中的数据，是保存到内存中的，一旦遇到服务器重启了，数据就会丢失。

之前的系统流程是这样的：

用户请求过来之后，先处理业务逻辑1，它是系统的核心功能。

然后再将任务提交到线程池，由它处理业务逻辑2，它是系统的非核心功能。

但如果线程池在处理的过程中，服务down机了，此时，业务逻辑2的数据就会丢失。

那么，如何保证数据不丢失呢？

答：需要提前做持久化。

我们优化的系统流程如下：

用户请求过来之后，先处理业务逻辑1，紧接着向DB中写入一条任务数据，状态是：待执行。

处理业务逻辑1和向DB写任务数据，可以在同一个事务中，方便出现异常时回滚。

然后有一个专门的定时任务，每个一段时间，按添加时间升序，分页查询状态是待执行的任务。

最早的任务，最先被查出来。

然后将查出的任务提交到线程池中，由它处理业务逻辑2。

处理成功之后，修改任务的待执行状态为：已执行。

需要注意的是：业务逻辑2的处理过程，要做幂等性设计，同一个请求允许被执行多次，其结果不会有影响。

如果此时，线程池在处理的过程中，服务down机了，业务逻辑2的数据会丢失。

但此时DB中保存了任务的数据，并且丢失那些任务的状态还是：待执行。

在下一次定时任务周期开始执行时，又会将那些任务数据重新查询出来，重新提交到线程池中。

业务逻辑2丢失的数据，又自动回来了。

如果要考虑失败的情况，还需要在任务表中增加一个失败次数字段。

在定时任务的线程池中执行业务逻辑2失败了，在下定时任务执行时可以自动重试。

但不可能无限制的一直重试下去。

当失败超过了一定的次数，可以将任务状态改成：失败。

这样后续可以人工处理。

最后说一句(求关注，别白嫖我)
如果这篇文章对您有所帮助，或者有所启发的话，帮忙扫描下发二维码关注一下，您的支持是我坚持写作最大的动力。

求一键三连：点赞、转发、在看。
关注公众号：【苏三说技术】，在公众号中回复：面试、代码神器、开发手册、时间管理有超赞的粉丝福利，另外回复：加群，可以跟很多BAT大厂的前辈交流和学习。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.hqwc.cn/news/789544.html

如若内容造成侵权/违法违规/事实不符，请联系编程知识网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

spring boot 以请求来调用Ollama大模型，不使用spring ai

之前有一版使用spring ai的，但是其实Ollama有一套api可以直接调用。api地址是https://github.com/ollama/ollama/blob/main/docs/api.md我们聊天其实调用的就是这个（其余的我就不赘述了，大家自行研究）调用http请求这方面，大家可自行编写，请求的方式五花八门，网上的库和组…

pg14+etcd+Patroni 高可用配置流程

pg14+etcd+Patroni 高可用配置流程目录pg14+etcd+Patroni 高可用配置流程基础配置IP 规划：修改超级用户密码：在主库上创建流复制用户修改 pg_hba 文件备库重新创建数据目录：开启watchdog创建.pgpass生成备库在备库修改同步信息备库查看主库查看同步信息安装etcd下载etcd安装…

vmware Docker 设置代理到宿主机的代理软件 vim /usr/lib/systemd/system/docker.service在[Service]处添加以下两行信息，将流量代理给宿主机的7890端口出外网Environment="HTTP_PROXY=http://192.168.31.1:7890"Environment="HTTPS_PROXY=http://192.168.31.1…

解决rancher部署k8s集群问题

一.问题概述国内网络使用docker部署，local集群会报错，并在创建rke2自定义集群时不成功，会卡住；二.问题分析这个问题主要是由于在使用docker run命令启动Rancher容器时，错误地映射了数据目录/var/lib/rancher到宿主机所导致的。下面是详细的问题分析和解决方案整理： 1.内…

使用 nuxi build 命令构建你的 Nuxt 应用程序

title: 使用 nuxi build 命令构建你的 Nuxt 应用程序 date: 2024/8/30 updated: 2024/8/30 author: cmdragon excerpt: nuxi build 命令是构建 Nuxt 应用程序的核心工具，它将你的应用程序打包成适合生产环境的格式。通过理解和使用不同的选项，如 --prerender、--dotenv 和 …

哈萨克语学习心得（一）——哈萨克语西里尔字母记忆法

最近开始学习基于西里尔文字的哈萨克语，慢慢梳理一下自己的学习心得。首先是字母的学习，虽然之前没有接触过西里尔文字，但是感觉自己在记忆字母这方面没什么太大的障碍，可能是因为西里尔字母来源于希腊字母吧，而之前数学和物理课上学到了很多希腊字母的发音，跟西里尔字母…

dp安装包升级步骤

1、jekens获取包 2、解压包包上传到服务器解压/root目录，空间大于6G3、进入到解压目录4、升级 mstsc -v 47.100.179.150:8219

世微 AP9195 7-24V 大功率升压恒流驱动芯片 LED照明与控制器方案

概述 AP9195 是一款高效率、高精度的升压型大功率 LED 灯恒流驱动控制芯片。 AP9195 内置高精度误差放大器，固定关断时间控制电路，恒流驱动电路等，特别适合大功率、多个高亮度 LED 灯串的恒流驱动。 AP9195 通过调节外置的电流采样电阻，能控制高亮度 LED 灯的驱动电流…

redis-shake4迁移数据（蛮好用）

redis-shake下载地址：https://github.com/tair-opensource/RedisShake/releases 测试环境redis需要从公有云迁移到私有云，就用redis-share测试一下。下载后解压（就两个文件，执行文件和配置文件）： [root@gcv-x-test-sharedb-oracle redis]# cat shake.toml ##我只需要复制…

redis-shake迁移数据（蛮好用）

Clickhouse备份与恢复

一、安装clickhouse-backup 1、下载安装包 cd /server/tools wget https://github.com/Altinity/clickhouse-backup/releases/download/v2.4.33/clickhouse-backup-linux-amd64.tar.gz2、创建存放clickhouse-backup的目录，并解压 mkdir -pv /data/clickhouse-backup tar xvf c…

AES加密算法

AES是个对称加密。AES支持三种长度的秘钥：128位（16字节），192位（24字节），256位（32字节）。加密由N轮构成，轮数依赖于密钥长度：16字节密钥对应10轮，24字节密钥对应12轮，32字节对应14轮。 AES为分组密码，分组密码也就是把明文分成一组一组的，每组长度相等，每次加密…