国内某头部理财服务提供商基于白鲸调度系统建立统一调度和监控运维

file

导读:国内某头部理财服务提供商成立于 2019 年,是股份制银行中首批获准筹建、首家获准开业、首家成立的银行理财子公司。自 2004 年推出国内首支人民币理财产品以来,通过投资模式的不断创新和投资管理能力的持续提升,引领国内银行业理财市场。该企业每天处理的任务量达 1W,内部系统众多,当务之急是需要一个统一的调度和监控平台,支持不同理财业务场景下的需求。

2023 年之前,该企业使用开源版本的大数据调度平台 Apache DolphinScheduler 能基本上满足业务需求,但随着业务量增大和个性化需求的增长,在经过周密的调研之后,决定将所有调度任务迁移到商业版本白鲸调度系统之上。

采用白鲸调度系统让该企业实现了统一调度和监控运维,调度性能大幅提高。本文将详细描述白鲸调度系统为该企业提供的解决方案和相关应用实践。

业务需求

国内某头部理财服务提供商所处的金融行业属于数据密集型行业,随着这个行业的不断发展和技术的不断进步,金融数据的数据量不断增加,数据来源也越来越多样化,其需要对数据质量进行严格的把控,并需要具备高效的数据处理和分析能力。此外,金融市场变化快速,风险控制需要实时响应,这对其数据处理和分析能力提出了更高的要求。同时,保护客户的隐私和机密信息,防范网络攻击和数据泄露等安全问题,都对该企业提出重要的挑战。

具体来说,该企业的产销、投资、风险评估、运营投资等团队都有自己的数据集市(数仓),每个团队都从需要的贴源层获取到自己需要的数据,经过各自团队的ETL 流程,将统计数据输出到各自的集市中,再把自己的集市数据分享给其他人。

由于每个团队都有各自的调度平台,这导致平台的维护成本非常高,运维管理也很不方便,另一方面也不能集中统计和管理所有团队的任务。

因此,统一调度系统的建设在该企业是当务之急。 在建设数据体系过程中,其需要基于信创环境下建设具有高性能、可靠性高、易扩展的调度系统,以满足该企业在数据体系建设中各类数据处理任务的统一调度和监控需求,实现统一调度和监控运维,支持不同场景下实现各自个性化的需求,保障数据体系的基础建设。

接到商业调度需求时,该企业当时的调度集群由 3 台 40C*256G 的机器组成,由两台 API 、3 个 Master 、3 个 Worker组成,每天处理 1 万量级的任务,将来可能到 3 万+/天。

具体到业务线上,该企业对建设调度系统有着如下需求:

  • 要支持各部门使用统一的调度系统,使用权限将各部门的资源进行隔离,保证系统运转的隔离性和安全性。
  • 要有丰富的监控和统计功能,支持统一的数据监控、运维服务的需求;
  • 调度系统要支持多种触发类型,比如事件、自定义日历、依赖调度等方式触发作业,支持用户灵活配置作业及组合工作流,实现在不同场景的调度需求;
  • 需要能结合该企业自身需求,支持信创组件、扩展性的任务类型、数据源类型、告警组件及其他扩展需求;
  • 支持分布式的架构及资源控制等方法,实现一个高可靠性,高处理性能的调度系统;
  • 支持定制化需求,比如和该企业的自身用户系统对接用户及权限数据,对接客户的统一登录平台,以及其他数据处理平台和告警平台。

基于白鲸调度系统的一站式解决方案

白鲸调度系统国产信创化调度平台,就是为了支持客户在数据体系建设中不同场景的任务调度需求,针对企业级用户对系统的稳定性、可靠性、合规性、高性能、支持信创环境等要求而开发出的商业化版本,定位于企业级统一调度平台,为企业的批处理任务制定统一的开发规范、运维方法,对各系统的批量任务进行统一管理、调度和监控。

白鲸调度系统继承了大数据调度平台 Apache DolphinScheduler强大的功能与易用性,同时增加了多项企业级功能以满足实际行业用户需求,让企业可以部署一套调度系统,减少维护成本,拥有强大的调度能力。

在明确需求后,白鲸开源自信白鲸调度系统能够满足客户的全部需求,着手分步骤、分阶段进行解决方案的实施部署。经过了一系列测试后,白鲸开源启动了实施方案,并帮助客户解决了部署前、部署中和部署后的一系列问题,为其交付了完整的解决方案。

整体技术方案

白鲸调度系统主要使用无中心架构的设计思想,通过注册中心发现服务,服务之间可以互为备份,保证了系统的可靠性的同时,也可以做到水平扩展服务数量,能够很好地支持企业千万级别的任务数量,完全满足金融业务场景数据处理量大的需求。

白鲸调度系统主要服务包括 UI 用户界面、接口层 API 服务,MasterServer、WorkerServer、AlertServer 五个模块,其中任务处理服务 MasterServer 和 WorkerServer 是典型的无中心架构,通过注册中心自动发现服务的启动和关闭,能有效支持任务数量激增和减少的场景,同时可以保证任务处理的可扩展性和高性能。

系统所有服务均采用分布式部署,支持高稳定性、高性能和高容错性,保证提供可持续使用的服务,即使客户的数据中心散步在全国各地,白鲸调度系统也能轻松应对来自客户不同部门数据系统的处理需求。

file

针对客户的需求,白鲸调度系统提供的解决方案让每个团队都拥有了自己的任务执行集群,调度系统是单独的集群,免密登录各自团队的集群,各团队都在调度上使用 shell 任务 的 ssh remote 'shell command' 来执行各自集群上的任务。

具体解决方案包括(由于保密需求,只透露部分信息):

多日历管理方便多个市场交易日、工作日、自然日管理

针对企业设计多种日历,支持调度日历、业务数据日历分开,并支持不同时区、日历导入等功能:

  • 支持多种日历管理:交易日、工作日、自然日等
  • 支持日历 Excel 模板导入
  • 支持调度日历与业务日历分开
  • 支持多时区设置
  • 支持日切时间设置

强大的业务数据日期功能更好满足金融行业需求

针对客户调度当中的业务数据日期单独进行设计,更好地满足金融行业需求:

  • 多次调度使用同一业务数据日期(例,最后一个交易日,如果不翻牌,数据指针停止在这一天,例如 ,9.30 不跑 10.1 七天 10.6日开始跑,依然跑的是 9.30 日)
  • 强大的业务翻牌任务
  • 支持前后自定义翻牌
  • 支持自定义脚本直接生成业务日期数值
  • 支持定时翻牌和任务结束翻牌
  • 配合日历,支持多种复杂函数用于数据处理
  • 前后 n 日、月(工作日、交易日、自然日)
  • 当前牌所在月、年(工作日、交易日、自然日)

file

事件驱动满足文件、Kafka、数据库级别灵活触发调度

除了日期时间触发之外,增加事件触发机制,满足企业多系统之间交互的需要:

  • 文件触发
    • 不同文件接口,根据满足特殊定义文件自动触发
    • 可以设置扫描频次与超时报警
  • 数据库触发
    • 满足特殊数据定义之后,自动触发任务
  • Kafka 触发
    • 发现符合定义消息息自动触发工作流

专业的权限设置与 Token 管理满足企业级别权限需要

针对企业设置用户、角色、权限为不同部门提供不同功能权限:

  • 企业用户管理
    • 独立企业用户账号,可以对接现有企业用户
  • 项目角色管理
    • 管理员角色、不同项目开发人员角色功能分开
    • 结合项目角色控制资源权限
  • Token 管理可以帮助企业设定 API 调用权限

file

详细的审计日志满足企业回溯用户行为审计功能

  • 审计日志记录用户详细操作对象以及时间:
  • 审计日志详细记录用户的操作行为
  • 可以设置日志保留时间
  • 支持Excel导出以及用户操作查询

file

高可扩展能力支持组件扩展

  • 系统高可靠、易扩展
  • 满足定制化需求,比如打通用户权限系统、和其他业务系统对接,扩展新的任务组件、数据源组件、告警组件,并支持对接客户自定义开发的血缘分析功能等。

file

支持信创环境

白鲸调度系统 在信创合规部署支持方面做到了完全的国产化: 支持国产服务器,国产 CPU、内存、主板、硬盘等,如鲲鹏服务器。

  • 支持国产操作系统,如中标麒麟、银河麒麟、红旗 Linux。
  • 支持国产数据库,如 达梦数据库、GaussDB、TiDB。
  • 支持对系统部署所涉及到的服务器、操作系统、中间件、数据库进行信创化改造,满足信创环境下系统迁移和原有任务调度的需求。

统一监控告警、运维

实现统一的监控和运维是客户统一调度最重要的目标之一,白鲸调度系统 可以提供统一监控告警,统一监控指标,提供丰富的API接口,满足用户定制化监控需求;统一监控告警平台、运维平台,极大减少维护成本;多种监控指标,根据权限智能统计指标,满足不同角色的监控需求;统一告警服务,提供丰富的告警插件,支持多种告警方式同时发送;集中监控工作流、任务运行情况和批量操作,统一管理告警列表、事件列表等。

客户收益

当前,该企业基于白鲸调度系统搭建了统一调度平台,助力管理后台实现了:

  • 为客户提供了统一调度平台,提高了数据处理效率,支撑了客户的技术部产销、投资、风险评估、运营投资各个团队的业务,后续将接入更多业务;
  • 降低了运维难度,降低非技术人员门槛
  • 提高交付效率
  • 快速调度
  • 灵活的数据分析

客户简介

国内某头部理财服务提供商,为投资者提供了丰富的投资产品,为客户创造了丰厚的投资回报。

本文由 白鲸开源科技 提供发布支持!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/102989.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

YOLOV8从零搭建一套目标检测系统(修改model结构必看)附一份工业缺陷检测数据集

目录 1.YOLOV8介绍 2.YOLOV8安装 2.1环境配置 3.数据集准备 1.YOLOV8介绍 Yolov8结构图: YoloV8相对于YoloV5的改进点: Replace the C3 module with the C2f module. Replace the first 6x6 Conv with 3x3 Conv in the Backbone. Delete two Convs …

hutool的HttpRequest.post的使用-包括上传文档等多个传参【总结版本】

首先hutool已经为我们封装好了远程调用的接口,我们只要将对应的传参和方式对应填写即可 hutool官方文档 1实际应用 post 常见的使用json传参,contend type为application/json RequestMapping("login") ResponseBody public static String s…

R语言应用interactionR包进行亚组相加交互作用分析

在统计分析中交互作用是指某因素的作用随其他因素水平变化而变化,两因素共同作用不等于两因素单独作用之和(相加交互作用)或之积(相乘交互作用)。相互作用的评估是尺度相关的:乘法或加法。乘法尺度上的相互作用意味着两次暴露的综合效应大于(…

RabbitMQ:work结构

> 只需要在消费者端,添加Qos能力以及更改为手动ack即可让消费者,根据自己的能力去消费指定的消息,而不是默认情况下由RabbitMQ平均分配了,生产者不变,正常发布消息到默认的exchange > 消费者指定Qoa和手动ack …

TLA+学习记录1——hello world

0x01 TLA是个好工具 编程人员一个好习惯是凡事都想偷懒,当然是指要科学地偷懒,而不是真的偷懒。一直想找到一种能检验写出的代码,做出的设计是否真的完全正确,而不是靠经验检视、代码Review、反复测试去检验。因为上述方法不管怎…

磐基2.0搭建es集群

参考: k8s安装elasticsearch集群 k8s安装elasticsearch集群_k8s部署elasticsearch集群_MasonYyp的博客-CSDN博客1 环境简述搭建es集群需要使用的技术如下:k8s集群、StatefulSet控制器、Service(NodePort)服务、PV、PVC、volumeC…

[SSM]MyBatisPlus拓展

五、拓展篇 5.1逻辑删除 在电商网站中,我们会上架很多商品,这些商品下架以后,我们如果将这些商品从数据库中删除,那么在年底统计商品的时候,这个商品要统计的,所以这个商品信息我们是不能删除的。 如果商城…

基于SpringBoot + Vue的项目整合WebSocket的入门教程

1、WebSocket简介 WebSocket是一种网络通信协议,可以在单个TCP连接上进行全双工通信。它于2011年被IETF定为标准RFC 6455,并由RFC7936进行补充规范。在WebSocket API中,浏览器和服务器只需要完成一次握手,两者之间就可以创建持久性…

向量数据库Milvus Cloud核心组件再升级,主打就是一个低延迟、高准确度

支持 ScaNN 索引 Faiss 实现的 ScaNN,又名 FastScan,使用更小的 PQ 编码和相应的指令集可以更为友好地访问 CPU 寄存器,从而使其拥有优秀的索引性能。该索引在 Cohere 数据集,Recall 约 95% 的时候,Milvus 使用 Knowhere 2.x 版本端到端的 QPS 是 IVF_FLAT 的 7 倍,HN…

系统架构技能之设计模式-工厂模式

一、开篇 本文主要是讲述设计模式中最经典的创建型模式-工厂模式,本文将会从以下几点对工厂模式进行阐述。 本文将会从上面的四个方面进行详细的讲解和说明,当然会的朋友可以之处我的不足之处,不会的朋友也请我们能够相互学习讨论。 二、摘…

leetcode56. 合并区间(java)

合并区间 题目描述贪心算法代码演示 题目描述 难度 - 中等 leetcode56. 合并区间 以数组 intervals 表示若干个区间的集合,其中单个区间为 intervals[i] [starti, endi] 。请你合并所有重叠的区间,并返回 一个不重叠的区间数组,该数组需恰好…

基于uwb和IMU融合的三维空间定位算法matlab仿真

目录 1.算法运行效果图预览 2.算法运行软件版本 3.部分核心程序 4.算法理论概述 5.算法完整程序工程 1.算法运行效果图预览 2.算法运行软件版本 matlab2022a 3.部分核心程序 ..........................................................................kkk 0; for E…