奇点云DataSimba R4.9 LTS发布:稳定性加固,架构升级,142项功能上新

不久前,奇点云的数据云全系产品如期发布新一季商业化版本更新:

  • 数据云平台DataSimba:R4.9 LTS版发布,稳定性全面加固,功能上新;自R4系列起架构升级,封装底层复杂性,支撑上层快速构建数据模型与应用。
  • 数据存算引擎DataKun:R2.0发布,在安全稳定、智能运维、云原生、自主可控等层面均有优化。
  • 数据安全引擎DataBlack:R2.0发布,支持全域数据安全,内置行业模型,开箱即用。
  • 数据服务工具箱Simba Toolkits:SimbaTag(标签工厂)、SimbaMetric(指标工厂)成为独立版本,可搭载于企业现有数据平台之上,为标签管理、指标管理提效。

本文聚焦DataSimba,解读稳定性加固、功能上新及架构升级。

 

稳定性加固,妥妥“企业级”

LTS,即Long Term Support,长期支持版。数据云DataSimba每个R系的最后一个版本,都作为LTS版发布。相较上一个LTS版(R3.8),DataSimba R4.9及DataKun R2.0进一步加固了稳定性,支持高可用、高并发、高效调度、高效运维

“企业客户使用DataSimba的深度和强度已不同以往。”奇点云合伙人、CTO地雷表示,“数据云必须具备足够的稳定性,方能保障数据全链路日常高效运行,基于业务需求产出结果。即便遇到故障、超负荷、误操作等情况,也能足够皮实不崩溃,及时反馈并定位问题,甚至能提前智能化给出预警,规避对业务的影响。”

在“企业级”标准要求下,本次更新主要围绕以下5项专题,开展稳定性优化:

(1)调度更智能、更可靠

DataSimba R4.9进一步优化了调度策略以及调度通讯框架,让调度更智能,有效减少“塞车”,保障系统稳定运行。

具体而言,我们分离了业务调度和资源调度,让彼此的职责更清晰、策略更易扩展,并结合实际业务场景,深层优化了通讯协议。优化项包括:

· 业务调度:基于任务特点进行了队列的拆分,在同一队列下再结合优先级、项目、租户、任务数、任务配置等进行综合打分,从而判断队列分发的顺序。

· 资源调度:基于节点并发数及负载程度进行即时的精准调度,大大提升任务执行的效率,实现负载均衡。

· 调度通讯框架:对通讯协议以及包的大小、发送、接收策略等多维度进行了深度优化,整体通讯性能提升了30%以上

(2)应用100%支持高可用

DataSimba R4.9内所有业务应用及中间件,均支持自动化的故障恢复与容错实现。在出现故障、失效等问题时,系统将继续正常运行并提供服务。

· 所有的业务应用都基于Kubernetes管理,同时支持多实例集群部署。

· 包括Redis、Kafka、K3s、Nacos等在内的所有中间件均支持高可用部署,业务代码已全部适配完成。针对部分中间件,我们也已完成版本升级,来进一步提升组件的可靠性和安全性。

(3)全方位监控告警

监控告警是稳定性重要的一环,方便事中事后快速发现与定位问题。DataSimba R4.9从业务、应用、中间件、服务器等多个维度,实现了监控告警全覆盖。

· 针对业务异常,依托自研的实时告警系统,基于业务指标采集和规则配置,可通过邮件、短信、钉钉等多渠道监控告警。

· 针对运维异常,采用现有成熟的告警平台,对Java虚拟机、线程池、内存、CPU、磁盘、网络等多维度实现全方位的监控与告警。

(4)引擎核心组件全量压测

在DataSimba底层,数据存算引擎DataKun也要足够稳定。

在本轮更新,数据存算引擎DataKun的核心组件完成全量压测,包括YARN、HDFS、Hive、Spark等在内的所有核心组件稳定性及性能均得到了充分验证。

压测基于DataSimba标准版的配置进行(专业版、旗舰版性能比标准版更高)。我们采用单压、混压的方式对DataSimba做假设性压测与功能验证。并结合压测结果数据,对组件进行配置调优,进一步提升集群的整体吞吐能力。

(5)系统破坏性测试

为了保障系统在极端场景下的可用性,DataSimba R4.9做了比R3时期更为严格的破坏性测试。

所谓破坏性测试,简单来说就是当面对异常、组件不可用等情况时,系统能否“稳住”,给出正确反馈——事实上,破坏性测试不仅会考察系统的监控告警能力,更考察系统自愈的能力及数据状态的一致性。

在完成应用破坏、中间件破坏、DataKun组件破坏等等多个场景的破坏性测试后,我们在本轮更新做了如下优化:

· 优化监控告警机制,出现组件异常时立即触发通知;

· 优化前端提示,出现故障时直观展现报错,便于用户定位问题;

· 增加重试策略,当组件恢复后系统可以自愈运行,减少人工干预;

· 迭代任务巡检机制,在极端情况下也能保障任务状态的一致性。

功能上新,从容应对复杂场景

相较于上一个LTS版本(R3.8),DataSimba R4.9 LTS共上新142项新功能,优化了113项功能,提供了32项问题的修复补丁,并基于用户研究进一步迭代了交互设计。

篇幅所限,本文仅简单介绍其中3项亮点功能,更详尽的Release Notes可以向您的客户成功经理、产品技术顾问了解。

  • 支持多租户,既安全又集约

DataSimba R4.9支持多租户,用户可以在DataSimba的一个工作空间(Workspace)里,为多个团队开设租户(Account),提供相互独立的空间,实现资源隔离。

基于多租户体系,企业的数据团队将以“平台”身份服务更多部门,合理优化资源利用,而不再出现多团队互抢资源的情况,也免去了各团队自行运管数据基础设施的烦恼。

为匹配多租户体系,我们采用了双层身份认证、双层权限校验、双层存储加密,来保证租户资源的强逻辑隔离与数据安全。同时,通过动态的权限管控,DataSimba R4.9支持租户间数据安全共享,而无需数据迁移成本。

 

  • Task/Job双层混合调度,提高执行效率及资源利用率

DataSimba R4.9采用Task/Job双层混合调度,任务(Task)与作业(Job)级别调度互相配合,以完成任务调度及资源分配。

其中,任务(Task)负责决定任务在可用资源上的调度顺序,控制任务的调度周期;作业(Job)则通过与Quota(空间域里的其中一个对象)配合,完成底层资源的调度与优化。

在双层混合调度体系中,我们加入了“潮汐车道”等调度策略,可由企业用户按需选择。例如,可以周期性调整资源,来平衡高峰期、低峰期资源的分配利用,也可以预留一定资源,确保高优先级任务完成。

  • 配置图引擎,支持图数据处理与图算法优化

DataSimba R4.9配置了图引擎(Graph Engine),支持用户通过DataSimba存储、管理、分析大规模的图数据,开发交互式的图计算作业,以及处理复杂的图算法。

以OneID场景为例,基于奇点云自研的“大规模多引擎混合调度技术”,我们采用了“流批图一体”架构——结合实时计算、离线计算、图计算三种引擎的能力,批处理的图计算结果对流计算的结果进行修正,再以API的方式对外(例如对分析云产品)提供服务。

业内独家的技术架构让奇点云全域OneID方案在计算性能、复杂场景计算及可解释性上均具优势。其中,图计算的高效图遍历和关联操作能力有效提高了海量多端用户融合分析的准确性。

架构升级,让数据模型与应用构建更简单

DataSimba R4与R3系列在架构上有极大不同。DataSimba R4.9(包括自R4.0以来的所有产品版本)在架构上分为3层,自上而下分别为:

- Simba Toolkits(数据服务工具箱):包含SimbaMetric(指标工厂)、SimbaTag(标签工厂)等多种效率工具,内置科学的数据工程方法论,帮助数据工程师提升数据资产研发效率。

- Simba IDE(数据云集成开发环境):提供离线同步、实时同步、监控告警、资产地图等功能,满足从数据集成到开发、运维及服务等全链路场景。

- Simba OS(云数仓内核):根据“资源抽象,接口统一”的原则,将一系列复杂的业务对象抽象为7个域、32个对象,向上支持数据业务。例如,“分级多域”、“多租户”业务数据逻辑隔离能力的实现,就得益于空间域中的工作空间对象、项目对象和项目成员对象;又如,要实现一个去中心化的DAG任务调度中间层及调度实例化,则需要利用任务域中的作业对象、任务对象和实例对象。

基于全新的架构,DataSimba以Simba OS为核心向下封装多引擎、多依赖、多云、海量多源异构数据等带来的复杂性,并基于统一的平台,向上(应用层)以API的方式提供标准能力,帮助用户简化数据模型/应用的研发过程。

伴随架构升级,整体后端服务资源消耗更少、分配更合理,一套新环境所需的最低服务资源也进一步得到削减。

 

为什么要升级架构?

越来越多企业客户正在走向数字化深水区,数据模型、数据应用建设的需求也越来越高频。DT部门需要从原本“接需求”的角色向“平台”角色转型,向各个组织单元提供数据能力,适应不同业务对数据使用的要求。

如果不解耦底层建设与数据业务、抽象底层能力,不仅难以快速响应高频的需求,重复造轮子,出现烟囱式建设,数据系统也会伴随企业使用而不断“加重”,扩展能力和技术升级受限。

因此奇点云基于对数据全链路各环节的理解,及过去多年实践的几百个项目,抽象出了7个域共32个对象。详尽准确的对象加上对象之间的关联关系,构成了Simba OS。Simba OS以简单、标准的RESTful API对外提供能力,从而解耦复杂的底层体系与多变的上层业务,来应对不同环境、不同数据业务场景的需求。

地雷介绍,对象的属性和行为可以被继承、更新、扩展及复用。每当需要支持一种新的数据业务场景,DataSimba的用户都可以像拼乐高积木一样,基于Simba OS快速搭建数据模型/应用,而规避底层重复建设、定义不一致、大数据引擎及IaaS对接难度高等问题。

“其实,我们的指标工厂SimbaMetric、标签工厂SimbaTag、数据安全引擎DataBlack就是基于Simba OS‘搭建’出来的,与DataSimba体系天然打通,且能同步享受DataSimba底层所有的能力升级。”

目前,DataSimba R4系列已在数十家企业级客户得到使用,其中不乏客户数据团队基于Simba OS自建数据应用的案例。

期待成为您的理想选择!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/8551.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

CSS圆角进化论

CSS圆角发展过程 大致经历了3个阶段,包括: 背景图片实现圆角CSS2.0标签模拟圆角CSS3.0圆角属性(border-radius属性)实现圆角 ☛背景图片实现圆角:使用背景图片实现圆角的方式很多,实现的方式和圆角的切图方式关系密…

Nacos服务注册成功,RestTemplate调用服务提供者时空指针异常(已解决)

发现问题并进行记录 目录 项目场景:问题描述原因分析解决 项目场景: RestTemplate也可以做服务调用(进行测试) 目的:解决该问题,不考虑其他远程调用方式(Fegin,Dubbo) 项目Pom文件 Spring Boot ----2.6.3 Spring Cloud------2021.0.1 Spring Cloud Al…

vue动态修改浏览器标题和logo

问题描述 需要将一个系统,更改一下标题、logo,然后部署成另一个系统,由于不想单独拉出一套代码(单独拉出来后维护成本增加),所以想要动态改变系统标题和图标 解决方案 将项目制造一个入口可以修改项目的…

Unity | HDRP高清渲染管线学习笔记:Rendering Debugger窗口

HDRP给我们提供了一套完整的可视化Debug工具,集成在Rendering Debugger窗口。通过顶部菜单Window→Analysis→Rendering Debugger可以打开窗口。Rendering Debugger窗口不仅仅可以在编辑模式下使用,也可以在真机上运行时使用。(要在真机上运行…

Numpy学习(参考)

目录 一、前言 二、numpy官方文档 文档划分 参数规范 相关知识明知 Routines学习(部分) 1、创建 2、数组操作常用 ufunc 三、numpy基本操作 开篇探索 数据类型 创建数组 创建数组有5种常规机制 常用创建方法 拷贝创建 数组运算 形状操作 查看形状 形状变换 …

linux中安装Nginx的具体步骤

1.首先介绍一下Ngnix nginx是一款使用c语言编写的高性能的HTTP和反向代理服务器,特点是占有内存少,并发能力强,事实上Nginx的并发能力确实在同类型的网页服务器中表现得最好,中国大陆使用Nginx网站用户有:百度、京东、…

自定义 MVC 框架思想

目录 一、MVC设计模式 1. 什么是MVC 2. 三层架构与MVC的区别 二、自定义MVC框架 1. 为什么要学习自定义MVC框架 2. 自定义MVC的工作原理 3. 自定义MVC框架的优势 三、自定义MVC实例流程 1. mvc三层架构的弊端 2. 自定义MVC的工作流程 2.1 子控制器(…

《Redis 核心技术与实战》课程学习笔记(一)

基本架构:一个键值数据库包含什么? 这样学 Redis,才能技高一筹 为了保证数据的可靠性,Redis 需要在磁盘上读写 AOF 和 RDB,但在高并发场景里,这就会直接带来两个新问题: 一个是写 AOF 和 RDB …

第十二章线程池

文章目录 享元模式手写数据库连接池 为什么需要线程池自定义线程池自定义拒绝策略接口自定义任务队列自定义线程池 JDK中的线程池常用的线程池的类和接口的之间的关系线程池状态构造方法线程池的工作流程拒绝策略 ExecuctorsnewFixedThreadPoolnewCachedThreadPoolnewSingleThr…

django celery简单 例子

django celery简单 例子 https://docs.celeryq.dev/en/latest/django/first-steps-with-django.html pip list pip install Django4.2.3 pip install redis4.6.0 pip install celery5.3.1 pip install SQLAlchemy2.0.17 source demo1_venv/bin/activate django-admin start…

二、QT工程中各个文件代表的含义

QT从入门到实战学习笔记 基本QT工程中各个文件知识1、main函数2、.pro工程文件3、QT5基本模块4、.h头文件 基本QT工程中各个文件知识 1、main函数 #include "mymainwindow.h" #include <QApplication> //包含一个应用程序类的头文件 //main程序入口 argc命…