首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
社区首页 >问答首页 >核心/自定义事实表

核心/自定义事实表
EN

Stack Overflow用户
提问于 2017-01-10 14:00:38
回答 1查看 373关注 0票数 0

我有一个按顺序/行粒度定义的事实表。每个订单都属于某个垂直的,并且每个垂直都有自定义属性来描述它的数据。我希望能够允许用户在所有订单之间进行查询,而不管是垂直的,但是当查询垂直特定的数据时,可以通过垂直特定的属性进行筛选。

这是我计划如何构造这个,但如果这看起来是一个好的设计,或者如果这是坏的,请推荐另一个方法。

事实表将包含VerticalKey FK。这些是我计划要做的总经理:

  1. DimVertical (超级型/核心)
代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
- VerticalKey (Auto Increment)
- OrderId (Alternate key)

  1. 直通车(亚型/自定义)
代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
- VerticalKey (Key Id from DimVertical.VerticalKey)
- CustomAttributeABC
- CustomAttributeDEF
- CustomAttributeGHI

  1. 双体垂直-摩托车(亚型/定制)
代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
- VerticalKey (Key from DimVertical.VerticalKey)
- CustomAttribute123
- CustomAttribute456 

为了跨所有订单进行查询,只需对超级类型DimVertical进行连接。但是,当我想要通过垂直的特定属性进行查询时,我只需要包含可选的子类型维度。

这看起来是个好办法吗?其次,如果这是一种很好的方法,那么让我们假设"OrderType“是一个超级类型属性,这样它就可以进入DimVertical维度了,这不好吗?我对此表示怀疑,因为我知道您不应该有一个标头维度,这是某种程度上是这样的,但我不知道如何支持“自定义”订单头搜索功能。

提前感谢!

EN

回答 1

Stack Overflow用户

发布于 2017-01-14 10:58:06

理论中,有三种可能的类层次结构映射到关系模式:

  • 每类层次结构表
  • 每个子类表
  • 每个混凝土级表

如果我对你说得对,你会按照每个子类策略遵循表。这可能很好,但在不知道数据的情况下是不能评论的。

最好的方法是简单地设置一个具有重要数据的样例模式;您将很快看到访问查询是否执行并且创建起来很简单。

根据我的经验,数据仓库设计中使用的一种方法是按类层次结构表(即所有子类都在一个表中实现),因为

  • 访问是有效的(没有联接)
  • 可能的不一致性(即您可以在摩托车记录中存储汽车属性)的缺点是数据仓库中的,而不是关键的,因为一致性通常是通过紧密的ETL作业而不是由数据库完成的。
票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/41579207

复制
相关文章
HAWQ取代传统数仓实践(十五)——事实表技术之无事实的事实表
本文介绍了数据仓库及其在技术社区中的应用,并重点讲解了数据仓库中的事实表和维度表的设计。在数据仓库中,通过将事实表与维度表关联,可以灵活地根据维度表中的属性进行查询。同时,通过在事实表和维度表之间建立关联,可以实现灵活的维度与度量之间的转换。最后,本文讲解了如何设计数据仓库以满足技术社区的需求,并提供了相应的示例。
用户1148526
2018/01/03
1K0
HAWQ取代传统数仓实践(十五)——事实表技术之无事实的事实表
事实表与维度表
如果你没有接触过数据库,想当然一下,估计答案多半是肯定的——系统里的一维表就是长这样子
公众号PowerBI大师
2020/06/05
2.2K0
维度模型数据仓库(十七) —— 无事实的事实表
(五)进阶技术         12. 无事实的事实表         本篇讨论一种技术,用来处理源数据中没有度量的需求。例如,产品源数据不包含产品数量信息,如果系统需要得到产品的数量,很显然不能简单地从数据仓库中直接得到。这时就要用到无事实的事实表技术。使用此技术可以通过持续跟踪产品的发布来计算产品的数量。可以创建一个只有产品(计什么数)和日期(什么时候计数)维度代理键的事实表。之所以叫做无事实的事实表是因为表本身并没有度量。         产品发布的无事实事实表  本节说明如何实现一个产品发布的无事实事实表,包括新增和初始装载product_count_fact表。图(五)- 12-1显示了跟踪产品发布数量的数据仓库模式(只显示与product_count_fact表有关的表)。
用户1148526
2022/06/14
9130
维度模型数据仓库(十七) —— 无事实的事实表
维度建模技术实践——深入事实表
它存储了业务过程中的各种度量和事实,而这些度量和事实正是下游数据使用人员所要关心和分析的对象。
Spark学习技巧
2021/07/27
1.6K0
维度建模技术实践——深入事实表
事实表,维度,度量,指标之间的关系
事实表:每个数据仓库都包含一个或者多个事实数据表。事实数据表可能包含业务销售数据,如销售商品所产生的数据,与软件中实际表概念一样
黄昏前黎明后
2019/09/11
2.5K0
Kettle构建Hadoop ETL实践(九):事实表技术
上两篇里介绍了几种基本的维度表技术,并用示例演示了每种技术的实现过程。本篇说明多维数据仓库中常见的事实表技术。我们将讲述五种基本事实表扩展,分别是周期快照、累积快照、无事实的事实表、迟到的事实和累积度量。和讨论维度表一样,也会从概念开始认识这些技术,继而给出常见的使用场景,最后以销售订单数据仓库为例,给出Kettle实现的作业、转换和测试过程。
用户1148526
2020/11/26
6K0
Kettle构建Hadoop ETL实践(九):事实表技术
数据仓库中的维度表和事实表概述
事实表 每个数据仓库都包含一个或者多个事实数据表。事实数据表可能包含业务销售数据,如现金登记事务所产生的数据,事实数据表通常包含大量的行。事实数据表的主要特点是包含数字数据(事实),并且这些数字信息可以汇总,以提供有关单位作为历史的数据,每个事实数据表包含一个由多个部分组成的索引,该索引包含作为外键的相关性纬度表的主键,而维度表包含事实记录的特性。事实数据表不应该包含描述性的信息,也不应该包含除数字度量字段及使事实与纬度表中对应项的相关索引字段之外的任何数据。 包含在事实数据表中的“度量值”有两中:一种是可以累计的度量值,另一种是非累计的度量值。最有用的度量值是可累计的度量值,其累计起来的数字是非常有意义的。用户可以通过累计度量值获得汇总信息,例如。可以汇总具体时间段内一组商店的特定商品的销售情况。非累计的度量值也可以用于事实数据表,单汇总结果一般是没有意义的,例如,在一座大厦的不同位置测量温度时,如果将大厦中所有不同位置的温度累加是没有意义的,但是求平均值是有意义的。 一般来说,一个事实数据表都要和一个或多个纬度表相关联,用户在利用事实数据表创建多维数据集时,可以使用一个或多个维度表。 维度表 维度表可以看作是用户来分析数据的窗口,纬度表中包含事实数据表中事实记录的特性,有些特性提供描述性信息,有些特性指定如何汇总事实数据表数据,以便为分析者提供有用的信息,维度表包含帮助汇总数据的特性的层次结构。例如,包含产品信息的维度表通常包含将产品分为食品、饮料、非消费品等若干类的层次结构,这些产品中的每一类进一步多次细分,直到各产品达到最低级别。 在维度表中,每个表都包含独立于其他维度表的事实特性,例如,客户维度表包含有关客户的数据。维度表中的列字段可以将信息分为不同层次的结构级。 结论
用户1220053
2019/05/26
4.7K0
HAWQ取代传统数仓实践(十六)——事实表技术之迟到的事实
一、迟到的事实简介         数据仓库通常建立于一种理想的假设情况下,这就是数据仓库的度量(事实记录)与度量的环境(维度记录)同时出现在数据仓库中。当同时拥有事实记录和正确的当前维度行时,就能够
用户1148526
2018/01/03
1.4K0
HAWQ取代传统数仓实践(十六)——事实表技术之迟到的事实
数据仓库:详解维度建模之事实表
一、事实表基础 二、事实表设计规则 三、事实表设计方法 四、有事实的事实表 五、无事实的事实表 六、聚集型事实表
五分钟学大数据
2022/12/29
2.8K0
数据仓库:详解维度建模之事实表
数据仓库(08)数仓事实表和维度表技术
所谓的事实表和维度表技术,指的就是如何和构造一张事实表和维度表,是的事实表和维度表,可以涵盖现在目前的需要和方便后续下游数据应用的开发。
张飞的猪
2022/11/06
1K0
数据仓库专题(11)-可以作为维度表使用的事实表
事实表从粒度的角度分为三种,分别是交易粒度事实表、周期快照事实表和累计快照事实表。
数据饕餮
2019/01/14
9720
Greenplum 实时数据仓库实践(8)——事实表技术
上一篇里介绍了几种基本的维度表技术,并用示例演示了每种技术的实现过程。本篇说明多维数据仓库中常见的事实表技术。我们将讲述五种基本事实表扩展技术,分别是周期快照、累积快照、无事实的事实表、迟到的事实和累积度量。和讨论维度表一样,也会从概念开始认识这些技术,继而给出常见的使用场景,最后以销售订单数据仓库为例,给出实现代码和测试过程。
用户1148526
2022/04/13
1.7K0
Greenplum 实时数据仓库实践(8)——事实表技术
HAWQ取代传统数仓实践(十七)——事实表技术之累积度量
本文介绍了对月销售订单历史记录的汇总统计,包括对订单金额、订单数量、产品信息、客户信息、销售员信息的统计,并分析了汇总数据的趋势变化。同时,本文还提供了对历史记录进行查询和过滤的方法,以及导出到Excel表格的示例代码。
用户1148526
2018/01/03
8700
HAWQ取代传统数仓实践(十七)——事实表技术之累积度量
分布式数据仓库最佳实践(21)- 事实表设计
本文是《分布式数据仓库最佳实践》系列文章的第四部分第21篇《事实表设计》,针对事实表设计专题进行详细论述,内容包括事实表的类型划分,各种类型的事实表应用的场景、具有的特性和典型的案例。配套视频课程地址:网易云课堂
数据饕餮
2019/03/11
9640
分布式数据仓库最佳实践(21)- 事实表设计
SpringBoot核心【自定义starter】
  为了加深对SpringBoot中自动装配的理解,我们自定义一个starter来实现,具体步骤如下
用户4919348
2019/05/15
7250
HAWQ取代传统数仓实践(十三)——事实表技术之周期快照
本文介绍了如何基于Falcon的Process进行大数据量ETL处理,并利用Oozie进行调度。通过在Falcon的Advanced Options中配置自定义的Shell脚本,可以实现对大数据量的ETL处理。同时,通过在Oozie中定义Sqoop Action,可以实现将数据抽取到Hive表中。Oozie会基于Falcon的Process定义生成对应的Action,并将其添加到Oozie Workflow中。最后,通过在Oozie Workflow中调用Sqoop Action,实现大数据量的ETL处理。
用户1148526
2018/01/03
1.8K0
HAWQ取代传统数仓实践(十三)——事实表技术之周期快照
HAWQ取代传统数仓实践(十四)——事实表技术之累积快照
本文总结了使用ETL处理大数据技术进行数据仓库建设的过程,包括数据提取、转换和加载(ETL)过程的构建和部署。主要介绍了ETL处理大数据的几种方法和技术,重点讲解了Apache NiFi和Talend这两个流行的开源ETL工具在大数据环境中的使用。
用户1148526
2018/01/03
2K0
HAWQ取代传统数仓实践(十四)——事实表技术之累积快照
Django自定义user表
需要注意的是我们自定义的表的表名必须是 auth_user ,而且必须有属性 is_active , is_staff , has_perm 和 has_module_perms 。
渔父歌
2019/03/04
1.1K0
数据仓库专题(3)-分布式数据仓库事实表设计思考
  最近在设计数据仓库的数据逻辑模型,考虑到海量数据存储在分布式数据仓库中的技术架构模式,需要针对传统的面相关系型数据仓库的数据存储模型进行技术改造。设计出一套真正适合分布式数据仓库的数据存储模型。
数据饕餮
2019/01/14
9690
用数据思维看事实
最近朋友推荐我看了一本书,汉斯.罗斯林(Hans Rosling)著的《事实》。书中作者开篇就提供了13道测试题,这些题目涉及人口、教育、环境、性别、健康等方面,根据作者做过的大量统计,除了气候变化的问题,对于其他12个问题,人们普遍表现出极大的无知,其中作者在2017年在14个国家中向12000人进行的调查中,人们平均在12个问题中只答对了2个,没有任何一个人得到满分,有15%的人回答错了所有的问题。
硬件大熊
2022/06/23
2480
用数据思维看事实

相似问题

使用Factless事实表作为事实表源

114

事实表的无事实事实与历史

11

事实表设计

11

事实表联接

10

事实表建议

21
添加站长 进交流群

领取专属 10元无门槛券

AI混元助手 在线答疑

扫码加入开发者社群
关注 腾讯云开发者公众号

洞察 腾讯核心技术

剖析业界实践案例

扫码关注腾讯云开发者公众号
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
查看详情【社区公告】 技术创作特训营有奖征文