首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >在设计数据仓库时使用暂存数据库的好处

在设计数据仓库时使用暂存数据库的好处
EN

Stack Overflow用户
提问于 2014-01-09 01:26:38
回答 4查看 42.6K关注 0票数 21

我正在设计一个数据仓库架构。在探索从生产中提取数据并放入数据仓库的各种选项时,我遇到了许多文章,其中主要建议采用以下两种方法:

  1. 生产数据库
  2. 生产数据库

我仍然不确定哪一种方法在性能和减少生产数据库的处理负载方面是更好的方法。

在设计数据仓库时,您发现哪种方法更好?

EN

Stack Overflow用户

回答已采纳

发布于 2014-01-09 03:23:30

以下要点摘自DWBI Organization's的文章

如果有下列任何方案之一,则可能需要暂放区域:

  1. Delta加载:您的数据是从源增量读取的,您需要一个中间存储,其中可以临时存储增量数据集,以便进行转换。
  2. 转换需要:在使用仓库中的数据之前,需要执行数据清理、验证等操作
  3. De-coupling:您的处理过程需要很多时间,并且您不希望在整个处理过程中保持与源系统的连接(据推测,源系统一直被实际业务用户使用),因此,您更愿意一次读取源系统中的数据,从源系统断开连接,然后在“自己的一侧”继续处理数据。
  4. 调试目的:您不必总是回到源代码,并且可以单独解决从暂存区域产生的问题(如果有的话)。
  5. 故障恢复:源系统可能是暂时的,数据的状态可能正在改变。如果您遇到任何上游故障,您可能无法重新提取您的数据,因为源已经改变了。有一个本地副本会有帮助

性能和减少的处理可能不仅仅是考虑因素。添加分期有时会增加latency (即从业务事件发生到报告之间的时间延迟)。但我希望以上各点能帮助你作出更好的判断。

票数 25
EN
查看全部 4 条回答
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/21010045

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档