首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >数据仓库建模:数据仓库与持久化分期区域

数据仓库建模:数据仓库与持久化分期区域
EN

Stack Overflow用户
提问于 2020-01-20 20:28:03
回答 2查看 1.4K关注 0票数 7

考虑以下两种DWH体系结构:

带有原始数据库的数据仓库,图层:

systems

  • Staging区域(在每次加载时截断,源表的精确模式)

  • 原始数据库(建模为数据库,包含记录历史记录、按源系统结构建模的集线器/sats/链接、不应用业务规则)、

  • 数据集市(维度模型、应用业务规则)、

具有持久分期区的DWH (称为PSA或HDA),层:

systems

  • Staging区域(每个负载上截断,源表的精确模式)
  • PSA(包含记录历史、源表模式+ date_ load /date_load_end列等)
  • 数据集市(维度模型、应用业务规则)

与PSA概念相比,原始数据库概念有什么好处吗?在我看来,Data建模在ETL方面增加了不必要的复杂性,而且在性能方面也比较慢。

很难找到一个真正好的答案,有什么想法吗?

谢谢!

EN

回答 2

Stack Overflow用户

发布于 2020-03-04 21:14:28

对于我来说,数据仓库和持久的分期区域听起来就像苹果和梨--很难比较。您不应该试图在不了解业务本体的情况下定义Data来捕获源数据--否则您正在构建一个源系统库,它对业务没有或几乎没有好处。在PSA或数据湖上建立一个数据仓库对我来说更有意义。将数据作为源系统的图像登陆,然后逐步建立一个可持续的数据收集系统。

票数 1
EN

Stack Overflow用户

发布于 2020-03-31 13:08:53

所添加的复杂性对应于前面在Data情况下引入的关系模型。我想这取决于您希望对数据建模并使其在不同的用例中重用的级别--结果是不同的数据集市。我的意思是,数据集市是为特定的业务案例而设计的,而数据库模型更多地被设计成总体(企业模型)。因此,基于DV模型的数据集市根本不需要物理地物化任何数据。可以设置一层视图,这些视图看起来像星型表,但实际上具有:

代码语言:javascript
运行
复制
•   Zero maintenance cost.
•   Zero storage costs.
•   High flexibility.

此外,知道数据在更一般的意义上(组织范围内)是如何关联的绝对是件好事--如果这些信息和所提到的优点证明了构建DV模型的额外努力是很难判断的话。

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/59830425

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档