首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >代理密钥在数据仓库Pros和Cons中的应用

代理密钥在数据仓库Pros和Cons中的应用
EN

Stack Overflow用户
提问于 2020-10-29 08:55:03
回答 1查看 151关注 0票数 0

代理密钥是一种机制,在我们的书中存在了多年,我讨厌再次讨论。每个人都在谈论使用代理密钥而不是业务密钥的好处。甚至和模型也在使用代理键。上述两个平台都提供了使用一个列连接维度和事实的能力,因此是一个代理键,因为在现实生活中很难有一个单一的业务密钥。

最近几年作为BI架构师,我在Analysis多维和表格中工作,我有多维项目,每晚在DataWarehouse中管理高达500 to的项目。我面临着从5-6个工会和8-10个有着数百万记录的表格中加入的事实。

这里有一个问题,使用代理键,为了能够知道维度键,我们需要做一个额外的连接。因此,如果我们想要将N维(在构造表达式中尚未与事实相关联)与单个事实“关联”,那么我们需要DataWarehouse中的N个附加连接。

让我们以前面的例子为例,对于这个特殊的事实,我们需要5-6个联合+ (8-10 + N)连接,它增加了复杂性,一旦我们需要将这个事实和10-15维关联起来,就可以得到代理键。

这些年来,我一直试着用我早期的咖啡来阅读我的事实表达式,比如阅读报纸,删除未使用的专栏,工会,加入,以及做任何事情来降低复杂性,以节省ETL处理时间。

它完全理解我们将节省查询DataWarehouse和语义层的时间,但是ETL呢,我遗漏了什么?

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2020-10-29 10:22:00

一些关于你的问题的想法..。

如果您不使用SKs,那么您将如何处理来自源系统的自然/业务键(即使是单个列)不会唯一的维度?

  1. DW的目的是使查询数据变得更容易和更快。如果您认为任何问题都需要一定的努力才能解决,那么您可以选择在产生解决方案所需的一系列活动中应用这种努力。如果您想减少查询的工作量,那么您需要增加数据准备工作,即您的ETL

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/64587765

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档