Spring Batch 简介

news/2024/10/6 22:01:07/文章来源:https://www.cnblogs.com/gongchengship/p/18290946

Spring Batch 是一个基于 Spring 框架的轻量级批处理框架,旨在帮助开发者构建健壮且高效的批处理应用程序。批处理是指处理大量数据的非交互式任务,通常涉及读取、处理和写入数据的过程。

Spring Batch 的主要功能

  1. 读/处理/写的抽象

    • ItemReader:用于从数据源读取数据。支持多种数据源,如数据库、文件、消息队列等。
    • ItemProcessor:用于处理数据。可以在读取数据后进行转换、过滤或其他处理操作。
    • ItemWriter:用于将处理后的数据写入目标位置,如数据库、文件、消息队列等。
  2. 批处理作业配置

    • Job:表示批处理作业的抽象,包含一个或多个步骤(Step)。
    • Step:表示作业中的一个单独的阶段或步骤,可以包括读取、处理和写入数据的逻辑。
  3. 事务管理

    • 支持事务管理,以确保数据的一致性和完整性。在作业失败时可以回滚事务,避免数据不一致。
  4. 并行处理

    • 支持并行处理,通过分片(Partitioning)、多线程(Multi-threading)和远程分区(Remote Partitioning)来提高处理效率。
  5. 重试和跳过

    • 支持重试机制,允许在处理过程中遇到暂时性错误时重试操作。
    • 支持跳过机制,允许在处理过程中遇到可忽略的错误时跳过这些错误。
  6. 作业监控和管理

    • 提供对批处理作业的监控和管理功能,包括作业的启动、停止、重启、统计和日志记录等。
  7. 持久化

    • 提供批处理作业的状态和执行历史的持久化功能,通常存储在关系数据库中。

Spring Batch 的应用场景

  1. 数据迁移和转换

    • 从一个数据库迁移数据到另一个数据库,或者将数据从一种格式转换为另一种格式。
  2. 批量数据处理

    • 处理大规模数据,如日志分析、统计报表生成等。
  3. ETL(抽取、转换、加载)

    • 数据仓库中的常见场景,从多个数据源抽取数据,进行清洗和转换后加载到数据仓库中。
  4. 定期任务

    • 定期执行的批处理任务,如定时生成报表、数据备份、数据清洗等。

示例代码

以下是一个简单的 Spring Batch 应用程序示例,展示了如何配置一个批处理作业,包括读取、处理和写入数据。

依赖项

在你的Maven项目中,添加Spring Batch的依赖项到pom.xml

<dependency><groupId>org.springframework.batch</groupId><artifactId>spring-batch-core</artifactId><version>4.3.4</version> <!-- 请使用最新版本 -->
</dependency>
<dependency><groupId>org.springframework.boot</groupId><artifactId>spring-boot-starter-batch</artifactId><version>2.5.6</version> <!-- 请使用最新版本 -->
</dependency>
<dependency><groupId>org.springframework.boot</groupId><artifactId>spring-boot-starter-data-jpa</artifactId><version>2.5.6</version>
</dependency>
<dependency><groupId>org.hsqldb</groupId><artifactId>hsqldb</artifactId><version>2.5.1</version>
</dependency>

配置类

import org.springframework.batch.core.Job;
import org.springframework.batch.core.Step;
import org.springframework.batch.core.configuration.annotation.EnableBatchProcessing;
import org.springframework.batch.core.configuration.annotation.JobBuilderFactory;
import org.springframework.batch.core.configuration.annotation.StepBuilderFactory;
import org.springframework.batch.core.launch.support.RunIdIncrementer;
import org.springframework.batch.core.step.tasklet.Tasklet;
import org.springframework.batch.core.step.tasklet.TaskletStep;
import org.springframework.batch.repeat.RepeatStatus;
import org.springframework.context.annotation.Bean;
import org.springframework.context.annotation.Configuration;@Configuration
@EnableBatchProcessing
public class BatchConfiguration {@Beanpublic Job job(JobBuilderFactory jobBuilderFactory, StepBuilderFactory stepBuilderFactory) {return jobBuilderFactory.get("job").incrementer(new RunIdIncrementer()).start(step1(stepBuilderFactory)).build();}@Beanpublic Step step1(StepBuilderFactory stepBuilderFactory) {return stepBuilderFactory.get("step1").tasklet(tasklet()).build();}@Beanpublic Tasklet tasklet() {return (contribution, chunkContext) -> {System.out.println("Executing tasklet step");return RepeatStatus.FINISHED;};}
}

主应用程序类

import org.springframework.boot.SpringApplication;
import org.springframework.boot.autoconfigure.SpringBootApplication;@SpringBootApplication
public class BatchApplication {public static void main(String[] args) {SpringApplication.run(BatchApplication.class, args);}
}

总结

Spring Batch 是一个功能强大且灵活的批处理框架,提供了丰富的功能来构建和管理批处理作业。它通过简化批处理作业的开发和管理,提高了开发效率和代码质量。Spring Batch 适用于各种批处理任务,包括数据迁移、批量数据处理、ETL任务和定期任务。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/740871.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

[Code Composer Studio] Memory Browser保存数据

造冰箱的大熊猫,适用于Code Composer Studio v5.5@cnblogs 2024/7/91、使用CCS>>View>>Memory Browser,可对目标板上的存储空间进行读写操作 2、要保存数据,在Memory Browser内,点击鼠标右键,在弹出的菜单中选择Save Memory 3、在Save Memory对话框中,在Fi…

[LeetCode] 135. Candy

和 238. Product of Array Except Self 计算除自己之外的乘积很像,先左侧遍历,再右侧遍历。 Hard不过如此。 class Solution:def candy(self, ratings: List[int]) -> int:# 1n = len(ratings)if n == 1:return 1# min element is not existif all(x == ratings[0] for x …

常用类

常用类 内部类 分类成员内部类 静态内部类 static 局部内部类 匿名内部类概念:在一个类的内部再定义一个完整的类 class Outer{class Inner{} }特点:编译之后可生成独立的字节码文件 (.class) 内部类可直接访问外部类的私有成员,而不破坏封装 可为外部类提供必要的内部…

一台 3000 元战未来主机装配方案

为了更好的阅读体验,请点击这里 下面是一个备选方案: CPU:酷睿I3 12100 四核八线程649 主板:微星H610M 爆破弹 金牌 569 内存:金百达16G 8GX2 3200 银爵 229 散热:赛普雷 涂城 双铜管散热器 49 固态:西数SN570 500G M2新蓝盘 249 显卡:UHD 730 电源:航嘉 GS400 好运来…

算法金 | 时间序列预测真的需要深度学习模型吗?是的,我需要。不,你不需要?

大侠幸会,在下全网同名「算法金」 0 基础转 AI 上岸,多个算法赛 Top 「日更万日,让更多人享受智能乐趣」参考 论文:https://arxiv.org/abs/2101.02118 更多内容,见微*公号往期文章: 审稿人:拜托,请把模型时间序列去趋势!! 使用 Python 快速上手 LSTM 模型预测时间序列…

Pandas我这个填充nan值为什么填充不上呢?

大家好,我是Python进阶者。 一、前言 前几天在Python钻石交流群【逆光】问了一个Python数据处理的问题,问题如下:请问一下,我这个填充nan值为什么填充不上呢二、实现过程 这里【瑜亮老师】给了个思路如下:试试看这样,代码如下: sf_mergetotal.loc[sf_mergetotal[寄件人]…

python matplot绘图工具练习

matplot 数据可视化 seaborn# pyplot import matplotlib.pyplot as plt import numpy as np import seaborn as sns import pandas as pdx_point = np.array([0,6]) y_point = np.array([0,100]) plt.plot(x_point,y_point,b-.v) # 格式处理 plt.show()x = np.arange(0,4…

R语言用逻辑回归、决策树和随机森林对信贷数据集进行分类预测|附代码数据

原文链接:http://tecdat.cn/?p=17950 最近我们被客户要求撰写关于的研究报告,包括一些图形和统计输出。在本文中,我们使用了逻辑回归、决策树和随机森林模型来对信用数据集进行分类预测并比较了它们的性能数据集是 credit=read.csv("gecredit.csv", header = T…

代码随想录算法训练营第27天 | 122.买卖股票的最佳时机 II 55. 跳跃游戏 1005.K次取反后最大化的数组和

122.买卖股票的最佳时机 II 给你一个整数数组 prices ,其中 prices[i] 表示某支股票第 i 天的价格。 在每一天,你可以决定是否购买和/或出售股票。你在任何时候 最多 只能持有 一股 股票。你也可以先购买,然后在 同一天 出售。 返回 你能获得的 最大 利润 。 解题: 思路:最…

R语言实现 Copula 算法建模相依性案例分析报告

原文链接:http://tecdat.cn/?p=6193 原文出处:拓端数据部落公众号copula是将多变量分布函数与其边缘分布函数耦合的函数,通常称为边缘。Copula是建模和模拟相关随机变量的绝佳工具。Copula的主要吸引力在于,通过使用它们,你可以分别对相关结构和边缘(即每个随机变量的分…

【视频讲解】Python、R时间卷积神经网络TCN与CNN、RNN预测时间序列3实例附代码数据

全文链接:https://tecdat.cn/?p=36944 原文出处:拓端数据部落公众号 本文旨在探讨时间卷积网络(Temporal Convolutional Network, TCN)与CNN、RNN在预测任务中的应用。通过引入TCN模型,我们尝试解决时间序列数据中的复杂依赖关系,以提高预测的准确性。本文首先介绍了TCN…

反转链表

目录L206 反转链表题目描述题解方法一:迭代方法二:递归L92 反转链表 II题目描述题解方法一:一遍扫描方法二:穿针引线L25 K个一组反转链表题目描述题解方法一:模拟 L206 反转链表 题目描述 给你单链表的头节点 head ,请你反转链表,并返回反转后的链表。 示例1:示例2:题…