数据平台“国产替代”掣肘在迁移?奇点云的工业制造实践解读

系列导读

如《“数据要素×”三年行动计划(2024—2026年)》指出,工业制造是“数据要素×”的关键领域之一。如何发挥海量数据资源、丰富应用场景等多重优势,以数据流引领技术流、资金流、人才流、物资流,对于制造企业而言是挑战更是机会。

奇点云梳理了与制造业多个细分领域客户的合作实践,逐篇呈现。

本篇以光纤通信企业为例,分享数据基础设施的“国产替代”实践。

背景:打破封锁,数据能力必须自主可控

光纤通信是我国重要基建,科技发展受全球瞩目。企业在打破海外垄断、以自主研发填补空白的同时,近年也开始将IT、DT等核心系统切换为信创环境,逐步实现国产替代,建设自主可控的数据能力。

“(数据能力建设)不仅是转型升级、降本增效的‘秘密武器’,帮助我们在激烈的市场竞争中脱颖而出,更是我们进一步保障供应链和数据资产安全的重要举措。”业内领先的某光纤企业曾在采访中表示。

以本篇分享的客户为例:客户在数年前已完成数据平台建设,并将数据实践从试点逐步拓展到了各个业务域。然而,因被美列入“实体名单”,原平台供应商IBM“断供”——客户可以继续使用产品,但IBM不再提供版本更新、漏洞修复及其他技术支持。

对于企业而言,数据正对经营决策、生产管控发挥关键作用,数据基础设施的稳定、可靠、安全之重要性也不言而喻。因此,客户立即着手构建自主可控的数据基建,培育自有的数据能力。

难点:海量数据,迁移掣肘

  • 产品需支持信创、安全可控

数据平台产品适配信创环境,只能算达到“准入门槛”。要确保“客户可控”,数据平台还需要满足:

· 产品足够稳定、可靠,能支撑越来越大量级的数据存算,并具备扩展能力,来满足不同阶段的数据业务需求。

· 采用可信开源技术,同时供应商需要具备开源技术运维的能力,时刻关注技术演进,第一时间修复开源组件可能出现的漏洞。

· 具备数据安全合规相关能力,包括敏感数据识别、数据分类分级、风险监控等等,保障数据资产安全的同时,为未来的数据要素流通做好准备。

  • 迁移海量数据的同时,保障数据业务不受影响

如前文所述,客户在数年前已经完成数据平台建设,积累了几十家子公司、几十个业务域的数据,数据量以TB为单位,覆盖数十个数据项目、数千个任务。不仅数据量极大,任务依赖关系也非常复杂。

将原有比较完整的数据建模体系铲平重建,显然是对数据资产的浪费。

因此,“替代”厂商不仅需要完成新平台的部署,还应完成历史数据的平滑、无损、准确、安全迁移,同时,数据业务保持正常运行,不因替换而搁置或中断。

大数据是有“重量”的,远不如拷贝单个文件那么简单,这也是许多企业在切换数据基建产品、进行国产替代的关键顾虑之一。

解决方案:自动化工具+专业团队,保障高效平滑迁移

奇点云数据云平台DataSimba是中立安全、稳定易用的数据云平台,从集成、研发、运维、治理到服务,为企业提供数据全生命周期运营管控的必备能力,且已完成从IT基础设施、基础软件到应用软件的全产业链信创产品兼容性互认证。

下文简单介绍从旧平台切换到DataSimba的实践过程。

  • ​​​​​​​数据平台分层规划支持多角色数据运营

客户面临典型的多子公司、多业务领域、多项目并行场景。除了总部的数据团队,还有各单位、应用供应商会在平台上进行数据开发,未来还可能接入上下游伙伴企业。

因此在前期,奇点云项目组从客户实际业务场景出发,制定了数据平台分层和项目划分策略,以保障平台的可维护性、可扩展性,提升后续各角色数据运营协作的效率。

具体如下:

· ODS(数据源层),负责原始数据的存储和管理。按系统名称进行拆分,有问题可快速定位到对应的业务系统。

· CDM(公共模型层),负责数据的清洗、转换、整合和计算,按业务领域,构建面向分析的业务过程通用模型。实际拆分为销售域、财务域、生产域、质量域、公共域等项目,项目间支持数据权限的逻辑隔离,并行开发互不影响。

· ADS(应用模型层),负责构建面向具体业务场景的分析模型。引用CDM数据,根据实际业务场景创建项目,如财务财报项目、财务管报项目等。

  • ​​​​​​​盘点数据资产,制定迁移方案

在迁移的准备期,奇点云项目团队对现有数据和第一阶段迁移的数百个任务进行了盘点,经过血缘分析、资源评估、影响评估等前置分析,明确了迁移对象和策略。

奇点云大数据业务迁移流程

上图为奇点云标准的大数据业务迁移流程。

其中,以迁移分析阶段的数据盘点为例:梳理数据源表清单、迁移任务清单、表结构、数据量以及任务上下游依赖,最终形成完整的待迁移元数据资产清单。

在最后的数据验证环节,则需考虑一致性、准确性、性能和功能验证,设计详细的测试用例和执行方案。

  • ​​​​​​​借助自动化迁移工具,实现平滑迁移

在迁移过程中,项目团队采用DataSimba内置的自动化工具,在数据预处理(清洗、格式转换)、批量迁移转化、数据校验等多个环节,显著减少繁琐的人工操作。以其中两项功能为例:

· 快速建表:利用DataSimba的数据集成功能,完成对项目中500张表的批量建表。

· 作业导入:DataSimba的作业批量导入功能,可以将预定义好的任务(包含任务名称、对应的项目以及依赖项等信息)快速导入平台。本次迁移,项目组快速导入了盘点好的数百个任务清单,改变原本创建任务、配置DAG必须依赖传统手工的情况,效率大大提升。

价值:好的国产,放心“替代”

在本次实践中,项目组遇到的最大挑战是项目周期短,而业务复杂度高,作业任务多,涉及到各分子公司的大量数据业务。因此,在完成产品选型和平台规划后,更重要的是基于业务情况制定可行的迁移规划,高效完成平滑迁移,同时保障数据业务不中断。

项目组采用自动化迁移代替“手工搬运”,相较传统方案,耗时缩短了50%,节约了“替代”的时间成本。

“替代”后的新数据平台(DataSimba)完全自主可控,支撑各分子公司、合作伙伴完成数据开发与运营。以生产域为例,基于新平台完成了对工厂海量IoT数据的实时采集、存算,结合算法模型,辅助现场质量检测,优化生产工艺,保障光纤产品质量。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/570711.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【Functional Affordances】如何确认可抓取的区域?(前传)

文章目录 1. 【Meta AI】Emerging Properties in Self-Supervised Vision Transformers2. 【Meta AI】DINOv2: Learning Robust Visual Features without Supervision3. 【NeurIPS 2023】Diffusion Hyperfeatures: Searching Through Time and Space for Semantic Corresponden…

机器学习——神经网络简单了解

一、神经网络基本概念 神经网络可以分为生物神经网络和人工神经网络 (1)生物神经网络,指的是生物脑内的神经元、突触等构成的神经网络,可以使生物体产生意识,并协助生物体思考、行动和管理各机体活动。 (2)人工神经网络,是目前热门的深度学习的研究…

rust中常用cfg属性和cfg!宏的使用说明,实现不同系统的条件编译

cfg有两种使用方式,一种是属性: #[cfg()],一种是宏:cfg! ,这两个都是非常常用的功能。 #[cfg()]是 Rust 中的一个属性 用于根据配置条件来选择性地包含或排除代码。cfg 是 "configuration" 的缩写&#xf…

jupyter lab使用虚拟环境

python -m ipykernel install --name 虚拟环境名 --display-name 虚拟环境名然后再启动jupyter lab就行了

项目设计方案:市交通视频监控平台项目设计方案(二)

目录 1 前言 1.1 目的 1.2 适用范围 1.3 术语表 2 现状分析 2.1 业务现状 2.2 组织机构现状 2.3 存在的问题 2.4 项目成果预期 3 系统建设原则 4 项目需求 4.1 项目需求 4.1.1 业务需求主要分为三部分: 4.1.2 技术需求主要分为四部分: 4.…

SpringBoot可以同时处理多少请求

SpringBoot默认的内嵌容器是Tomcat,即看Tomcat可以处理多少请求 默认配置 server:tomcat:threads:min-spare: 10 # 最小工作线程数max: 200 # 最大线程数max-connections: 8192 # 接受和处理的最大连接数,超过8192的请求就会被放入到等待队列中ac…

52个AIGC视频生成算法模型介绍

基于Diffusion模型的AIGC生成算法日益火热,其中文生图,图生图等图像生成技术普遍成熟,很多算法从业者开始从事视频生成算法的研究和开发,原因是视频生成领域相对空白。 AIGC视频算法发展现状 从2023年开始,AIGC视频的新…

安全漏洞周报(2024.03.18-2024.03.25)

漏洞速览 ■ Atlassian Confluence 路径遍历漏洞(CVE-2024-21677) ■用友U8cloud SQL注入漏洞 漏洞详情 1.Atlassian Confluence 路径遍历漏洞(CVE-2024-21677) 影响组件: Atlassian Confluence Data Center是面向大型企业和组织的高可用性、可扩展性和高性能版本…

IDEA编辑国际化.properties文件没有Resource Bundle怎么办?

问题描述 最近在做SpringBoot国际化,IDEA添加了messages.properties、messages_en_US.properties、messages_zh_CN.properties国际化文件后,在编辑页面底部没有Resource Bundle,这使得我在写keyvalue的时候在每个properties文件都要拷贝一次…

微信小程序使用Vant组件库流程

目前 Vant 官方提供了 Vue 2 版本、Vue 3 版本和微信小程序版本,并由社区团队维护 React 版本和支付宝小程序版本。这样开发原生微信小程序的会方便很多。 官方网址:Vant Weapp - 轻量、可靠的小程序 UI 组件库 步骤一 通过 npm 安装 npm i vant/weap…

SpringCloud-Eureker配置中心搭建

一、基于本地配置文件的 Eureker配置中心搭建 1.、创建一个springBoot项目 <properties><project.build.sourceEncoding>UTF-8</project.build.sourceEncoding><java.version>1.8</java.version><component.version>0.0.1-SNAPSHOT</…

Qt 图形视图 /图形视图框架坐标系统的设计理念和使用方法

文章目录 概述Qt 坐标系统图形视图的渲染过程Item图形项坐标系Scene场景坐标系View视图坐标系map坐标映射场景坐标转项坐标视图坐标转图形项坐标图形项之间的坐标转换 其他 概述 The Graphics View Coordinate System 图形视图坐标系统是Qt图形视图框架的重要组成部分&#xf…