我所在的公司正在启动我们整个DWH的重新设计过程。其想法是迁移到云解决方案,并使用数据湖概念。从湖中,数据应该被传递到一个3NF DWH,最后,通过市场最终用户。
这些集市的目的将是多种多样的。从报告到会计和培训ML模型。
我有机会在设计这些市场的过程中扮演重要的角色,但我从来没有这样做过。
你对从哪里开始有什么建议吗?一本书,一篇文章?
我希望这是提出这样一个问题的正确地方,并感谢你的贡献。
发布于 2021-02-08 19:31:52
这个问题可能会以基于意见的方式结束(我会投得太广),但作为我职业生涯中在这个领域工作过的人,我可以提供我的观点如下:
他们的好书还是好文章?没有我能找到的。所有我学到的东西都回到了井里,试错了,或者有几个真的很好,所以答案可以指引我走向正确的方向。
这些链接可提供一些指导/观点:
dba.SE:关系数据库中的完整性约束应该被忽略 (因为在DWH/数据集市中缺少FK/唯一约束对我来说一直是个令人头疼的问题)
https://dba.stackexchange.com/questions/284955
复制相似问题