考虑以下两种DWH体系结构:
带有原始数据库的数据仓库,图层:
systems
具有持久分期区的DWH (称为PSA或HDA),层:
systems
与PSA概念相比,原始数据库概念有什么好处吗?在我看来,Data建模在ETL方面增加了不必要的复杂性,而且在性能方面也比较慢。
很难找到一个真正好的答案,有什么想法吗?
谢谢!
发布于 2020-03-04 21:14:28
对于我来说,数据仓库和持久的分期区域听起来就像苹果和梨--很难比较。您不应该试图在不了解业务本体的情况下定义Data来捕获源数据--否则您正在构建一个源系统库,它对业务没有或几乎没有好处。在PSA或数据湖上建立一个数据仓库对我来说更有意义。将数据作为源系统的图像登陆,然后逐步建立一个可持续的数据收集系统。
发布于 2020-03-31 13:08:53
所添加的复杂性对应于前面在Data情况下引入的关系模型。我想这取决于您希望对数据建模并使其在不同的用例中重用的级别--结果是不同的数据集市。我的意思是,数据集市是为特定的业务案例而设计的,而数据库模型更多地被设计成总体(企业模型)。因此,基于DV模型的数据集市根本不需要物理地物化任何数据。可以设置一层视图,这些视图看起来像星型表,但实际上具有:
• Zero maintenance cost.
• Zero storage costs.
• High flexibility.
此外,知道数据在更一般的意义上(组织范围内)是如何关联的绝对是件好事--如果这些信息和所提到的优点证明了构建DV模型的额外努力是很难判断的话。
https://stackoverflow.com/questions/59830425
复制相似问题