本文是《分布式数据仓库最佳实践》系列文章的第四部分第21篇《事实表设计》,针对事实表设计专题进行详细论述,内容包括事实表的类型划分,各种类型的事实表应用的场景、具有的特性和典型的案例。配套视频课程地址:网易云课堂
首先,明确第一个问题:事实表是分类型的,既包括包含明确可度量指标的事实表,如订单事件;也包括没有明确的可度量数值的事实表,如网民的对网站的一次访问。 其次,对于包含事实的事实表,也可以根据事实表本身的特性,进行类型划分,具体而言就包括:事务型事实表、周期快照事实表和累积快照事实表。其各自使用的场景、具备的特性和典型案例如上图所示。 再次,事实表的设计,要基于自己业务特性和场景特点进行模型的选择,以使用为准,同时选择了某种事实表以后,伴随的问题就是要接受其固有特性。如事务型事实表具有数据系数的特点,因为只有事件发生时,才会有相应的记录产生。选择这种模式,就必须接受这类特点。当然我们也会有相应的协作策略和协调机制解决这类问题。
本文是《分布式数据仓库最佳实践》系列文章的第四部分第21篇《事实表设计》,针对事实表设计专题进行详细论述,内容包括事实表的类型划分,各种类型的事实表应用的场景、具有的特性和典型的案例。