软信天成:一文详解拥有可观测性能力的数据目录

近年来,数据治理和数据可观测性被越来越多的企业广泛采用。现代数据系统为用户提供多项功能和精准服务,允许用户以不同形式自由存储和查询相关数据,但随着功能增加以及系统间快速产生的海量、可变化数据,可能会导致数据漂移、数据模式更改、数据延迟等情况发生,最终致使系统难以正常运行。因此,企业拥有可观测性能力的数据目录显得尤为重要,准确及时的数据信息可以帮助您在激烈的竞争中获得优势

数据可观测性,通过收集系统中数据的运行状况,实时地监控、检测和解决数据问题,确保数据产品和业务决策的数据质量、可靠性和可用性。值得一提的是,数据可观测性提供了预测数据行为和异常阈值发送警报的额外优势,便于组织更及时、准确地了解系统运行的真实状态。

可观测性的四大支柱

数据可观测性是运行并改善数据健康的关键特性的总和,而软信数据目录具备原生的数据可观测性的能力,如下:

1. 元数据:数据的外部特征

元数据通常被定义为“关于数据的数据”,但在软信天成看来,元数据更是“关于独立于数据本身之外的数据”,其拥有数据量(行数)、数据结构(模式)和数据及时性(新鲜度)等属性。

优势:便于用户了解数据的结构,对于提高数据可靠性和减少数据宕机时间至关重要。同时元数据与数据的内部指标可用于识别数据质量问题,为组织内部提供正确的数据信息。

2. 血缘:数据之间的依赖关系

在数据世界中,主要的内部交互是将一个数据集从另一个数据集中派生出来,上游数据派生下游数据,这就是我们常说的数据血缘关系;其详尽描述了系统之间、表之间、表中的列之间以及列中的值之间的复杂数据加工逻辑。

优势:通过数据血缘,能全面理解数据之间的关系,以此分析数据质量问题的上游根本原因和下游影响。

3. 指标:数据的内部特征

数据内部特征则是反映所存储的数据的本体特征属性,包括数据模式分布汇总、数据平均值、标准差、偏度、敏感特性等。

优势:通过计算完整性、是否包括敏感信息和准确性等指标来描述数据本身,这使得基于指标而实时监测异常情况,使得及时进行告警成为可能,可以极大程度上减少数据损坏

4. 日志:数据与用户之间建立联系

通过描述数据内部状态的指标、描述其外部阶段的元数据以及描述数据间的血缘关系外,我们进一步描述数据如何与外部世界的用户进行交互。我们将这些交互分解为机器-数据的交互、数据-用户交互。

优势

  • 机器-数据交互:包括移动和转换,可以通过ELT工具、dbt作业来进行。
  • 数据-用户交互:通过类似数据工程团队创建新模型,利益相关者使用决策面板,或者数据工程师创建机器学习模型,让用户更了解并使用数据,以此做出正确的决策

综上,我们通过描述数据外部特征的元数据、描述数据之间依赖关系的数据血缘、描述数据内部特征的指标以及描述数据与用户建立联系的日志,便能够完全掌握数据在任何时间点的状态。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/497836.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

基于Redo log Undo log的MySQL的崩溃恢复

基于Redo log & Undo log的MySQL的崩溃恢复 Redo log Undo log Redo log 重做日志,记录,修改过的数据 Undo log 回滚日志,记录修改之前的数据 两个我不做详细的介绍了,redo log就是记录哪些地方被修改了 undo log是记录修改之前我们的数据长什么样 更新流程 我们来捋一…

实例:NX二次开发抽取平面以及标准柱面中心线

一、概述 最近体验许多外挂,包括胡波外挂、星空外挂及模圣等都有抽取面的中心线,由于刚刚学习,我尝试看看能不能做出来,本博客代码没有封装函数,代码有待改进,但基本可以实现相应的功能。 二、案例实现的功…

rtthread stm32h743的使用(三)uart串口设备使用

我们要在rtthread studio 开发环境中建立stm32h743xih6芯片的工程。我们使用一块stm32h743及fpga的核心板完成相关实验,核心板如图: 1.建立新工程,选择相应的芯片型号及debug引脚及调试器 2.打开cubemux,设置外部时钟及串口外设…

亚马逊云科技实时 AI 编程助手 Amazon CodeWhisperer,开发快人一步

​ ​ Amazon CodeWhisperer 是一款 AI 编码配套应用程序,可在 IDE 中生成 整行代码和完整的函数代码建议,以帮助您更快地完成更多工作。在本系列 文章中,我们将为您详细介绍 Amazon CodeWhisperer 的相关信息,敬请 关注&#xff…

c++之static的作用

目录 1、C语言 ​2、c(拓展) (1)static修饰成员变量 (I)static修饰变量之后成为静态变量,在编译时就会产生空间; (II)解决思路: a、目标要求: b、原则&am…

基于Java SSM springboot+VUE+redis实现的前后端分类版网上商城项目

基于Java SSM springbootVUEredis实现的前后端分类版网上商城项目 博主介绍:多年java开发经验,专注Java开发、定制、远程、文档编写指导等,csdn特邀作者、专注于Java技术领域 作者主页 央顺技术团队 Java毕设项目精品实战案例《500套》 欢迎点赞 收藏 ⭐…

Python实现向量自回归移动平均与外生变量模型(VARMAX算法)项目实战

说明:这是一个机器学习实战项目(附带数据代码文档视频讲解),如需数据代码文档视频讲解可以直接到文章最后获取。 1.项目背景 向量自回归移动平均与外生变量模型(Vector Autoregression Moving Average with Exogenous…

金融行业专题|期货超融合架构转型与场景探索合集(2023版)

更新内容: 更新 SmartX 超融合在期货行业的覆盖范围、部署规模与应用场景。新增 CTP 主席系统实践与评测、容器云资源池等场景实践。更多超融合金融核心生产业务场景实践,欢迎下载阅读电子书《SmartX 金融核心生产业务场景探索文章合集》。 面对不断变…

【机器学习】线性回归模型(Linear Regression)

🌸博主主页:釉色清风🌸文章专栏:机器学习🌸今日语录:温柔的一半是知识,没有知识的涵养撑不起你想要的风骨。 ☘️0文章预览 本系列文章主要是根据吴恩达老师的机器学习课程以及自己的理解整合而成&#xf…

electron安装最后一部卡住了?

控制台如下错误 不是的话基本可以划走了 这个很可能是镜像出现问题了,不一定是npm镜像 打开npm的配置文件添加下述 electron_mirrorhttps://cdn.npmmirror.com/binaries/electron/ electron_builder_binaries_mirrorhttps://npmmirror.com/mirrors/electron-build…

机器人内部传感器阅读梳理及心得-速度传感器-模拟式速度传感器

速度传感器是机器人内部传感器之一,是闭环控制系统中不可缺少的重要组成部分,它用来测量机器人关节的运动速度。可以进行速度测量的传感器很多,如进行位置测量的传感器大多可同时获得速度的信息。但是应用最广泛、能直接得到代表转速的电压且…

《TCP/IP详解 卷一》第10章 UDP和IP分片

目录 10.1 引言 10.2 UDP 头部 10.3 UDP校验和 10.4 例子 10.5 UDP 和 IPv6 10.6 UDP-Lite 10.7 IP分片 10.7.1 例子:IPV4 UDP分片 10.7.2 重组超时 10.8 采用UDP的路径MTU发现 10.9 IP分片和ARP/ND之间的交互 10.10 最大UDP数据报长度 10.11 UDP服务器…