读DAMA数据管理知识体系指南02数据管理(下)

news/2025/2/23 8:28:05/文章来源:https://www.cnblogs.com/lying7/p/18731602

1. 数据优化计划

1.1. 数据也许被视为独立于业务流程存在

1.2. 业务流程与支持它们的技术之间的关系

1.3. 系统的设计和架构及其所生成和存储的数据

1.4. 使用数据的方式可能被用于推动组织战略

1.5. 更好的数据规划需要有针对架构、模型和功能设计的战略路径

1.6. 挑战在于,通常存在组织、时间和金钱方面的长期压力,因而阻碍了优化计划的执行

2. 元数据和数据管理

2.1. 组织需要可靠的元数据去管理数据资产,从这个意义上讲应该全面地理解元数据

2.2. 元数据描述了一个组织拥有什么数据,它代表什么、如何被分类、它来自哪里、在组织之内如何移动、如何在使用中演进、谁可以使用它以及是否为高质量数据

2.3. 数据是抽象的,上下文语境的定义和其他描述让数据清晰明确

  • 2.3.1. 它们使数据、数据生命周期和包含数据的复杂系统易于理解

2.4. 挑战在于,元数据是以数据形式构成的,因此需要进行严格管理

  • 2.4.1. 管理不好数据的组织根本不管理元数据

  • 2.4.2. 元数据管理是全面改进数据管理的起点

3. 数据管理需要多角度思考

3.1. 数据管理是跨职能的工作

3.2. 建立企业的视角

  • 3.2.1. 数据是组织中的“横向领域”之一,它跨越不同垂直领域,如销售、营销和运营

  • 3.2.2. 数据治理变得越来越重要的一个原因是帮助组织跨垂直领域做出数据决策

3.3. 生产数据的人常常忘记后续有人需要使用数据

3.4. 了解数据的潜在用途有助于更好地规划数据生命周期,并据此获得更高质量的数据

3.5. 由于数据会被误用,因此要考虑减少误用的风险

3.6. 不同种类的数据

  • 3.6.1. 由于不同数据类型具有不同的需求,与不同的风险相关,并且在一个组织中扮演不同的角色,因此许多数据管理工具都集中在分类和控制方面

3.7. 数据管理和技术

  • 3.7.1. 成功的数据管理需要对技术做出正确的决策,但管理技术与管理数据不同

4. 数据生命周期

4.1. 数据的生命周期基于产品的生命周期,它不应该与系统开发生命周期混淆

4.2. 包括创建或获取、移动、转换和存储数据并使其得以维护和共享的过程,使用数据的过程,以及处理数据的过程

4.3. 在数据的整个生命周期中,可以清理、转换、合并、增强或聚合数据

4.4. 随着数据的使用或增强,通常会生成新的数据,因此其生命周期具有内部迭代,而这些迭代没有显示在图表上

4.5. 数据很少是静态的,管理数据涉及一系列内部互动的过程,与数据生命周期保持一致

4.6. 数据不仅具有生命周期,而且具有血缘(它从起点移动到使用点的路径,也称为数据链)​

  • 4.6.1. 生命周期和血缘相互交叉,有助于相互理解

  • 4.6.2. 一个组织越了解数据的生命周期和血缘关系,管理数据的能力就越强

4.7. 重要影响

  • 4.7.1. 创建和使用是数据生命周期中的关键点

  • 4.7.2. 数据质量管理必须贯穿整个数据生命周期

  • 4.7.2.1. 低质量的数据意味着成本和风险,而不是价值

  • 4.7.3. 元数据质量管理必须贯穿整个数据生命周期

  • 4.7.3.1. 元数据是数据的一种形式,并且由于组织依赖它来管理其他数据,所以元数据质量必须以与其他数据质量相同的方式进行管理

  • 4.7.4. 数据管理还包括确保数据安全,并降低与数据相关的风险

  • 4.7.5. 数据管理工作应聚焦于关键数据

  • 4.7.5.1. 生命周期管理要求将重点放在组织关键的数据上,并将数据ROT(冗余的Redundant、过时的Obsolete、碎片化的Trivial)降至最低

5. 数据和风险

5.1. 数据不仅代表价值,也代表风险

  • 5.1.1. 不准确、不完整或过时的低质量数据,因为其信息不正确明显代表风险

  • 5.1.2. 数据的风险在于,它可能被误解和误用

5.2. 最高质量的数据带给组织最大的价值——可获得、相互关联、完整、准确、一致、及时、适用、有意义和易于理解

5.3. 对于很多重要的决定而言存在信息的缺口——已知信息和须知信息之间的差异

6. 高效的数据管理需要领导力和承诺

6.1. 没有关于数据的战略蓝图,同时低估了数据管理相关的工作

6.2. 倡导首席数据官(CDO)的作用源于认识到管理数据会带来独特的挑战,成功的数据管理必须由业务驱动,而不是由IT驱动

6.3. CDO不仅领导倡议发起,他还必须领导文化变革,使组织能够对其数据采取更具战略性的方法

7. 数据管理战略

7.1. 战略是一组选择和决策,它们共同构成了实现高水平目标的高水平行动过程

7.2. 战略计划是为实现高水平目标而采取的高水平行动

7.3. 数据战略应该包括使用信息以获得竞争优势和支持企业目标的业务计划

7.4. 数据战略必须来自对业务战略固有数据需求的理解:组织需要什么数据,如何获取数据,如何管理数据并确保其可靠性以及如何利用数据

7.5. 数据战略需要一个支持性的数据管理战略——一个维护和改进数据质量、数据完整性、访问和安全性的规划,同时降低已知和隐含的风险

  • 7.5.1. 必须解决与数据管理相关的已知挑战

7.6. 数据管理战略由CDO拥有和维护,并由数据治理委员会支持的数据管理团队实施

7.7. 数据管理战略的组成

  • 7.7.1. 令人信服的数据管理愿景

  • 7.7.2. 数据管理的商业案例总结

  • 7.7.3. 指导原则、价值观和管理观点

  • 7.7.4. 数据管理的使命和长期目标

  • 7.7.5. 数据管理成功的建议措施

  • 7.7.6. 符合SMART原则(具体、可衡量、可操作、现实、有时间限制)的短期(12~24个月)数据管理计划目标

  • 7.7.7. 对数据管理角色和组织的描述,以及对其职责和决策权的总结

  • 7.7.8. 数据管理程序组件和初始化任务

  • 7.7.9. 具体明确范围的优先工作计划

  • 7.7.10. 一份包含项目和行动任务的实施路线图草案

7.8. 数据管理战略规划的可交付成果

  • 7.8.1. 数据管理章程

  • 7.8.1.1. 包括总体愿景、业务案例、目标、指导原则、成功衡量标准、关键成功因素、可识别的风险、运营模式等

  • 7.8.2. 数据管理范围声明

  • 7.8.2.1. 包括规划目的和目标(通常为3年)​,以及负责实现这些目标的角色、组织和领导

  • 7.8.3. 数据管理实施路线图

  • 7.8.3.1. 确定特定计划、项目、任务分配和交付里程碑

8. 数据管理框架

8.1. DAMA框架针对不同抽象级别提供了一系列关于如何管理数据的路径

  • 8.1.1. 这些视角提供了可用于阐明战略、制定路线图、组织团队和协调职能的洞察力

8.2. 战略一致性模型和阿姆斯特丹(Amsterdam)信息模型,展示了组织管理数据的高阶关系

  • 8.2.1. 战略一致性模型

  • 8.2.1.1. Strategic Alignment Model, SAM

  • 8.2.1.2. 抽象了各种数据管理方法的基本驱动因素​,模型的中心是数据和信息之间的关系

  • 8.2.1.3. 战略选择的4个基本领域:业务战略、IT战略、组织和流程以及信息系统

  • 8.2.2. 阿姆斯特丹信息模型

  • 8.2.2.1. The Amsterdam Information Model, AIM

  • 8.2.2.2. 与战略一致性模型一样,从战略角度看待业务和IT的一致性

  • 8.2.2.3. SAM(战略一致性模型)和AIM(阿姆斯特丹信息模型)框架从横轴(业务/IT战略)和纵轴(业务战略/业务运营)两个维度详细描述组件之间的关系

8.3. DAMA-DMBOK框架

  • 8.3.1. DAMA车轮图、六边形图和语境关系图

  • 8.3.1.1. DAMA车轮图呈现的是一组知识领域的概要

  • 8.3.1.2. 六边形图展示了知识领域结构的组成部分

  • 8.3.1.3. 语境关系图显示了每个知识领域中的细节

  • 8.3.2. 描述了由DAMA定义的数据管理知识领域,并解释了它们在DMBOK中的视觉表现

  • 8.3.3. 语境关系图中的列表是说明性的,而不是详尽的

  • 8.3.3.1. 对于不同的组织活动事项有不同的应用方式

  • 8.3.3.2. 高级角色列表只包括最重要的角色

  • 8.3.3.3. 每个组织都可以调整该模式来满足自己的需求

8.4. 以DAMA为基础重新排列组件,以便于更好地理解和描述它们之间的关系

8.5. 供给者

  • 8.5.1. 负责提供或允许访问活动输入的人员

8.6. 消费者

  • 8.6.1. 直接受益于数据管理活动产生主要交付成果的消费方

8.7. DMBOK金字塔

  • 8.7.1. Aiken

  • 8.7.2. 大多数组织在开始管理数据之前都没有定义完整的数据管理战略

  • 8.7.3. 通常都是在不太理想的条件下朝着这种能力发展

  • 8.7.4. 第1阶段:组织购买包含数据库功能的应用程序

  • 8.7.4.1. 意味着组织以此作为数据建模、设计、数据存储和数据安全的起点

  • 8.7.5. 第2阶段:一旦组织开始使用应用程序,他们将面临数据质量方面的挑战,但获得更高质量的数据取决于可靠的元数据和一致的数据架构,它们说明了来自不同系统的数据是如何协同工作的

  • 8.7.6. 第3阶段:管理数据质量、元数据和架构需要严格地实践数据治理,为数据管理活动提供体系性支持

  • 8.7.7. 第4阶段:该组织充分利用了良好管理数据的好处,并提高了其分析能力

8.8. 学习DAMA知识领域的另一种方法是探索它们之间的依赖关系

  • 8.8.1. 可靠的数据质量、数据设计和数据交互操作实践是可靠系统和应用的基础

  • 8.8.2. 只关注直接生命周期功能的组织,从其数据中获得的价值要少于那些通过基础活动和治理活动支持数据生命周期的组织

8.9. 生命周期管理活动源于数据的使用:主数据使用、文件和内容管理、商务智能、数据科学、预测分析、数据可视化

8.10. 数据治理(Data Governance)

  • 8.10.1. 通过建立一个能够满足企业需求的数据决策体系,为数据管理提供指导和监督

8.11. 数据存储和操作(Data Storage and Operations)

  • 8.11.1. 以数据价值最大化为目标,包括存储数据的设计、实现和支持活动以及在整个数据生命周期中,从计划到销毁的各种操作活动

8.12. 数据处理伦理(Data Handling Ethics)

  • 8.12.1. 描述了关于数据及其应用过程中,数据伦理规范在促进信息透明、社会责任决策中的核心作用

8.13. 大数据和数据科学(Big Data and Data Science)

  • 8.13.1. 描述了针对大型的、多样化数据集收集和分析能力的提高而出现的技术和业务流程

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/888255.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

全新方案80M/S,告别限速!

聊一聊 资源和文件转载的最佳方式是通过网盘链接分享,这种方式的优点在于可以避免地区、局域网和文件大小的限制。近年来,随着123云盘、阿里云盘和夸克网盘等网盘逐步崭露头角,各具优势。然而,依然没能撼动百度网盘老大哥的位置,据统计,百度网盘的依然是众多网盘中用户群…

windows zookeeper启动

如果启动后闪退则 在 zkEnv.cmd 配置日志输出级别 增加 TRACEFILE: 重新启动后在 logs 目录下查看日志输出 : 出现8080 端口占用 在zoo.cfg 增加jetty 启动的端口: admin.serverPort=9000 参考:https://blog.csdn.net/l123lgx/article/details/136627491

markdown笔记软件,windows端选用

要求从剪切板粘贴图片,可以自定义相对位置。 类似typora的所见即所得渲染。 代码块高亮(最好有一键复制功能) 大纲功能。层级关系用起来会更舒服。 Typora几乎是没有对手的,如果不收费就没有别的软件什么事了。淘汰项 ide工具 vscode和idea是我首先排除的,专业的工具做专业…

广州移动大众从化0月租卡在哪里购买?怎么办理?

https://xsjcloud.com V*x:gzydc00月租卡的好处有哪些呢 1,真正的零月租 (接电话免费),不用不扣费 2,不用不扣费,打电话即可触发 3,需到广州指定移动营业厅激活号码(广州润粤移动厅,从化移动综合楼厅),到手如实 4,可注册其他平台账号,微信号等, 广州润粤服务厅办…

ThreadPoolExecutor的内部类Worker详细解析

一、定义 ThreadPoolExecutor 的内部类 Worker 是线程池的核心实现之一,它封装了线程和任务,并负责执行任务。Worker 类继承自 AbstractQueuedSynchronizer(AQS), 并实现了 Runnable 接口。通过 Worker,线程池能够高效地管理线程的生命周期和任务的执行 1、Worker 类的设…

webdriver打开Chrome闪退问题的解决方法

现状:webdriver控制打开Chrome后闪退解决方案:强制等待,使用time.sleep()

noip 2025.2.22

T3 题目大意: 给你一棵树和一个排列 \(p\),定义 \(l \sim r\) 的 \(val\) 值为 \(dep_{LCA(p_{l \sim r})}\),求 \[\sum_{i = 1}^n \sum_{j=i}^n val_{l, r} \]\(n \le 6 \times 10^5\) 赛时思路: 先将 p 给直接映射上去。 考虑 \(\text{dsu on tree}\),用 set 维护每个子…

Java基础day3

Scanner对象 方法的重载 方法的调用 命令行传参 可变参数 数组 类与对象 封装,继承-extendsJava基础day3 Scanner对象Scanner scanner=new Scanner(System.in);if(scanner.hasNext()){//用next接收String str=scanner.nextLine();System.out.println("输出内容…

2025-02-22-steampy-on-steam

Why 官方 插件僅做了 Chrome 版本,並且尚未上架,想給 FF 也做一個。因爲功能比較簡單,所以試圖用 Tampermonkey 做了一個版本出來,想着自己湊合中,因爲本人不需要代購價格,所以僅僅顯示 CDKey 的價格。總體樣式和官方的差距比較多,這個只是一個 Demo 腳本,後續有空了會…

[题解]AtCoder Beginner Contest 394(ABC394)

A - 22222 遍历字符串\(s\),按题意输出所有2即可。点击查看代码 #include<bits/stdc++.h> #define int long long using namespace std; string s; signed main(){cin>>s;for(auto a:s) if(a==2) cout<<a;return 0; }B - cat 按题意模拟即可。点击查看代码 …

GitOps项目上篇之Argo CD环境准备

作者:尹正杰 版权声明:原创作品,谢绝转载!否则将追究法律责任。 目录一.GitOps概述1.什么是GitOps2.基于Argo实现GitOps方案架构二.GitOps项目环境准备实战案例1.主机角色规划2.部署gitlab相关环境3.部署k8s相关环境4.部署ArgoCD默认启用tls环境基于NodePort暴露4.1 Argo概…

[tldr] 配置windows terminal使用git bash

windows terminal默认使用power shell作为shell,但是power shell不好用,还是习惯linux的命令行行为. 参考Windows Terminal 配置 Git Bash 添加新的配置文件在windows terminal中点击设置选项点击添加配置文件按钮编辑配置内容 一个配置文件主要来自之前的配置文件的内容主要分…