1. 数据优化计划
1.1. 数据也许被视为独立于业务流程存在
1.2. 业务流程与支持它们的技术之间的关系
1.3. 系统的设计和架构及其所生成和存储的数据
1.4. 使用数据的方式可能被用于推动组织战略
1.5. 更好的数据规划需要有针对架构、模型和功能设计的战略路径
1.6. 挑战在于,通常存在组织、时间和金钱方面的长期压力,因而阻碍了优化计划的执行
2. 元数据和数据管理
2.1. 组织需要可靠的元数据去管理数据资产,从这个意义上讲应该全面地理解元数据
2.2. 元数据描述了一个组织拥有什么数据,它代表什么、如何被分类、它来自哪里、在组织之内如何移动、如何在使用中演进、谁可以使用它以及是否为高质量数据
2.3. 数据是抽象的,上下文语境的定义和其他描述让数据清晰明确
- 2.3.1. 它们使数据、数据生命周期和包含数据的复杂系统易于理解
2.4. 挑战在于,元数据是以数据形式构成的,因此需要进行严格管理
-
2.4.1. 管理不好数据的组织根本不管理元数据
-
2.4.2. 元数据管理是全面改进数据管理的起点
3. 数据管理需要多角度思考
3.1. 数据管理是跨职能的工作
3.2. 建立企业的视角
-
3.2.1. 数据是组织中的“横向领域”之一,它跨越不同垂直领域,如销售、营销和运营
-
3.2.2. 数据治理变得越来越重要的一个原因是帮助组织跨垂直领域做出数据决策
3.3. 生产数据的人常常忘记后续有人需要使用数据
3.4. 了解数据的潜在用途有助于更好地规划数据生命周期,并据此获得更高质量的数据
3.5. 由于数据会被误用,因此要考虑减少误用的风险
3.6. 不同种类的数据
- 3.6.1. 由于不同数据类型具有不同的需求,与不同的风险相关,并且在一个组织中扮演不同的角色,因此许多数据管理工具都集中在分类和控制方面
3.7. 数据管理和技术
- 3.7.1. 成功的数据管理需要对技术做出正确的决策,但管理技术与管理数据不同
4. 数据生命周期
4.1. 数据的生命周期基于产品的生命周期,它不应该与系统开发生命周期混淆
4.2. 包括创建或获取、移动、转换和存储数据并使其得以维护和共享的过程,使用数据的过程,以及处理数据的过程
4.3. 在数据的整个生命周期中,可以清理、转换、合并、增强或聚合数据
4.4. 随着数据的使用或增强,通常会生成新的数据,因此其生命周期具有内部迭代,而这些迭代没有显示在图表上
4.5. 数据很少是静态的,管理数据涉及一系列内部互动的过程,与数据生命周期保持一致
4.6. 数据不仅具有生命周期,而且具有血缘(它从起点移动到使用点的路径,也称为数据链)
-
4.6.1. 生命周期和血缘相互交叉,有助于相互理解
-
4.6.2. 一个组织越了解数据的生命周期和血缘关系,管理数据的能力就越强
4.7. 重要影响
-
4.7.1. 创建和使用是数据生命周期中的关键点
-
4.7.2. 数据质量管理必须贯穿整个数据生命周期
-
4.7.2.1. 低质量的数据意味着成本和风险,而不是价值
-
4.7.3. 元数据质量管理必须贯穿整个数据生命周期
-
4.7.3.1. 元数据是数据的一种形式,并且由于组织依赖它来管理其他数据,所以元数据质量必须以与其他数据质量相同的方式进行管理
-
4.7.4. 数据管理还包括确保数据安全,并降低与数据相关的风险
-
4.7.5. 数据管理工作应聚焦于关键数据
-
4.7.5.1. 生命周期管理要求将重点放在组织关键的数据上,并将数据ROT(冗余的Redundant、过时的Obsolete、碎片化的Trivial)降至最低
5. 数据和风险
5.1. 数据不仅代表价值,也代表风险
-
5.1.1. 不准确、不完整或过时的低质量数据,因为其信息不正确明显代表风险
-
5.1.2. 数据的风险在于,它可能被误解和误用
5.2. 最高质量的数据带给组织最大的价值——可获得、相互关联、完整、准确、一致、及时、适用、有意义和易于理解
5.3. 对于很多重要的决定而言存在信息的缺口——已知信息和须知信息之间的差异
6. 高效的数据管理需要领导力和承诺
6.1. 没有关于数据的战略蓝图,同时低估了数据管理相关的工作
6.2. 倡导首席数据官(CDO)的作用源于认识到管理数据会带来独特的挑战,成功的数据管理必须由业务驱动,而不是由IT驱动
6.3. CDO不仅领导倡议发起,他还必须领导文化变革,使组织能够对其数据采取更具战略性的方法
7. 数据管理战略
7.1. 战略是一组选择和决策,它们共同构成了实现高水平目标的高水平行动过程
7.2. 战略计划是为实现高水平目标而采取的高水平行动
7.3. 数据战略应该包括使用信息以获得竞争优势和支持企业目标的业务计划
7.4. 数据战略必须来自对业务战略固有数据需求的理解:组织需要什么数据,如何获取数据,如何管理数据并确保其可靠性以及如何利用数据
7.5. 数据战略需要一个支持性的数据管理战略——一个维护和改进数据质量、数据完整性、访问和安全性的规划,同时降低已知和隐含的风险
- 7.5.1. 必须解决与数据管理相关的已知挑战
7.6. 数据管理战略由CDO拥有和维护,并由数据治理委员会支持的数据管理团队实施
7.7. 数据管理战略的组成
-
7.7.1. 令人信服的数据管理愿景
-
7.7.2. 数据管理的商业案例总结
-
7.7.3. 指导原则、价值观和管理观点
-
7.7.4. 数据管理的使命和长期目标
-
7.7.5. 数据管理成功的建议措施
-
7.7.6. 符合SMART原则(具体、可衡量、可操作、现实、有时间限制)的短期(12~24个月)数据管理计划目标
-
7.7.7. 对数据管理角色和组织的描述,以及对其职责和决策权的总结
-
7.7.8. 数据管理程序组件和初始化任务
-
7.7.9. 具体明确范围的优先工作计划
-
7.7.10. 一份包含项目和行动任务的实施路线图草案
7.8. 数据管理战略规划的可交付成果
-
7.8.1. 数据管理章程
-
7.8.1.1. 包括总体愿景、业务案例、目标、指导原则、成功衡量标准、关键成功因素、可识别的风险、运营模式等
-
7.8.2. 数据管理范围声明
-
7.8.2.1. 包括规划目的和目标(通常为3年),以及负责实现这些目标的角色、组织和领导
-
7.8.3. 数据管理实施路线图
-
7.8.3.1. 确定特定计划、项目、任务分配和交付里程碑
8. 数据管理框架
8.1. DAMA框架针对不同抽象级别提供了一系列关于如何管理数据的路径
- 8.1.1. 这些视角提供了可用于阐明战略、制定路线图、组织团队和协调职能的洞察力
8.2. 战略一致性模型和阿姆斯特丹(Amsterdam)信息模型,展示了组织管理数据的高阶关系
-
8.2.1. 战略一致性模型
-
8.2.1.1. Strategic Alignment Model, SAM
-
8.2.1.2. 抽象了各种数据管理方法的基本驱动因素,模型的中心是数据和信息之间的关系
-
8.2.1.3. 战略选择的4个基本领域:业务战略、IT战略、组织和流程以及信息系统
-
8.2.2. 阿姆斯特丹信息模型
-
8.2.2.1. The Amsterdam Information Model, AIM
-
8.2.2.2. 与战略一致性模型一样,从战略角度看待业务和IT的一致性
-
8.2.2.3. SAM(战略一致性模型)和AIM(阿姆斯特丹信息模型)框架从横轴(业务/IT战略)和纵轴(业务战略/业务运营)两个维度详细描述组件之间的关系
8.3. DAMA-DMBOK框架
-
8.3.1. DAMA车轮图、六边形图和语境关系图
-
8.3.1.1. DAMA车轮图呈现的是一组知识领域的概要
-
8.3.1.2. 六边形图展示了知识领域结构的组成部分
-
8.3.1.3. 语境关系图显示了每个知识领域中的细节
-
8.3.2. 描述了由DAMA定义的数据管理知识领域,并解释了它们在DMBOK中的视觉表现
-
8.3.3. 语境关系图中的列表是说明性的,而不是详尽的
-
8.3.3.1. 对于不同的组织活动事项有不同的应用方式
-
8.3.3.2. 高级角色列表只包括最重要的角色
-
8.3.3.3. 每个组织都可以调整该模式来满足自己的需求
8.4. 以DAMA为基础重新排列组件,以便于更好地理解和描述它们之间的关系
8.5. 供给者
- 8.5.1. 负责提供或允许访问活动输入的人员
8.6. 消费者
- 8.6.1. 直接受益于数据管理活动产生主要交付成果的消费方
8.7. DMBOK金字塔
-
8.7.1. Aiken
-
8.7.2. 大多数组织在开始管理数据之前都没有定义完整的数据管理战略
-
8.7.3. 通常都是在不太理想的条件下朝着这种能力发展
-
8.7.4. 第1阶段:组织购买包含数据库功能的应用程序
-
8.7.4.1. 意味着组织以此作为数据建模、设计、数据存储和数据安全的起点
-
8.7.5. 第2阶段:一旦组织开始使用应用程序,他们将面临数据质量方面的挑战,但获得更高质量的数据取决于可靠的元数据和一致的数据架构,它们说明了来自不同系统的数据是如何协同工作的
-
8.7.6. 第3阶段:管理数据质量、元数据和架构需要严格地实践数据治理,为数据管理活动提供体系性支持
-
8.7.7. 第4阶段:该组织充分利用了良好管理数据的好处,并提高了其分析能力
8.8. 学习DAMA知识领域的另一种方法是探索它们之间的依赖关系
-
8.8.1. 可靠的数据质量、数据设计和数据交互操作实践是可靠系统和应用的基础
-
8.8.2. 只关注直接生命周期功能的组织,从其数据中获得的价值要少于那些通过基础活动和治理活动支持数据生命周期的组织
8.9. 生命周期管理活动源于数据的使用:主数据使用、文件和内容管理、商务智能、数据科学、预测分析、数据可视化
8.10. 数据治理(Data Governance)
- 8.10.1. 通过建立一个能够满足企业需求的数据决策体系,为数据管理提供指导和监督
8.11. 数据存储和操作(Data Storage and Operations)
- 8.11.1. 以数据价值最大化为目标,包括存储数据的设计、实现和支持活动以及在整个数据生命周期中,从计划到销毁的各种操作活动
8.12. 数据处理伦理(Data Handling Ethics)
- 8.12.1. 描述了关于数据及其应用过程中,数据伦理规范在促进信息透明、社会责任决策中的核心作用
8.13. 大数据和数据科学(Big Data and Data Science)
- 8.13.1. 描述了针对大型的、多样化数据集收集和分析能力的提高而出现的技术和业务流程