1、数仓的概念和了解--业务的痛点
产生的痛点:数据资产比较模糊、数据的质量比较低、重复建设、代码的耦合性比较强。
2、数据仓库中的常见的模型:
1、心型模型:中间是一张事实表,周围都是维度表。
对于心型模型的主要的特点:
非正规化、不存在渐变维度、有冗余数据、查询的效率比较高、不用过多的考虑正规化因素,设计维护是比较简单。
2、雪花模型:指的是在心型模型的基础上,在维度表上面还存在维度表。
主要的特点:
正规化、数据冗余比较少,有些数据需要连接才能获取,效率会比较低,规范化操作比较复杂,导致设计后期的维护比较困难 。在实际的应用中会将雪花模型和心型模型结合使用。
3、维度表的设计的方法:
选择维度、 确定维表、梳理维度关系、定义维度属性
4、事实表的设计流程:
5、ONE DATA数据模型
1、one data 一种元素只出现一次,在数仓中只能被定义一次。
2、逻辑架构:
数据域:是指一类数据的,比如说在在一个公司中包含不同的部门,每一个部门就类似一个域,例如业务部门可以称为业务域。