3.3 DataVault模型
Data Vault是Dan Linstedt发起创建的一种模型方法论,Data Vault是在ER模型的基础上衍生而来,模型设计的初衷是有效的组织基础数据层,使之易扩展、灵活的应对业务的变化,同时强调历史性、可追溯性和原子性,不要求对数据进行过度的一致性处理。同时设计的出发点也是为了实现数据的整合,并非为数据决策分析直接使用。
Data Vault模型是一种中心辐射式模型,其设计重点围绕着业务键的集成模式。这些业务键是存储在多个系统中的、针对各种信息的键,用 于定位和唯一标识记录或数据
Data Vault模型包含三种基本结构 :
中心表-Hub :唯一业务键的列表,唯一标识企业实际业务,企业的业务主体集合
链接表-Link: 表示中心表之间的关系,通过链接表串联整个企业的业务关联关系
卫星表- Satellite: 历史的描述性数据,数据仓库中数据的真正载体
3.3.1 中心表-Hub
3.3.2 链接表-Link
3.3.3 卫星表- Satellite
3.3.4 Data Vault模型​​​​​​建模流程
梳理所有主要实体
将有入边的实体定义为中心表
将没有入边切仅有一个出边的表定义为中心表
源苦衷没有入边且有两条或以上出边的表定义为连接表
将外键关系定义为链接表
尖叫提示:Hub想像成人体的骨架,那么Link就是连接骨架的韧带组织, 而satelite就是骨架上的血肉。 Data Vault是对ER模型更近一步的规范化,由于对数据的拆解和更偏向于基础数据组织,在处理分析类场景时相对复杂, 适合数仓低层构建,目前实际应用场景较少