首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

数据仓库设计规范

Data Warehouse Detail DWD 数据源的细节层,有的也称为ODS层,是业务层与数据仓库的隔离层,在该层可以把业务表分的更细 Data Warehouse Base DWB 数据仓库基础数据层...Data Warehouse History DWH 该层不在数据仓库设计的范围之内,按照业务新增的数据层,主要储存历史数据。...Data Warehouse Exception DWE 该层不在数据仓库设计的范围之内,按照业务新增的数据层,主要储存异常数据。...Enterprise Data Warehouse EDW 作为企业唯一的数据仓库,EDW提供统一的数据服务,查询结果有效一致。数据设计支持跨部门,支持海量数据,并支持大量的查询请求。...生产报表,也支持adhoc查询,数据反范式设计。 Data Lake Database DLD 该层存储非加工数据,比如日志、视频等,以后结构化数据,并且不分类,没有为了特定程序进行设计和加工。

51510

数据仓库设计规范

以下是常用的数据仓库术语,请按照需求创建schema名字,其中DWH与DWE不是数据仓库的术语 名词 名词简称 名词解释 Data Warehouse DW 数据仓库主体 Operational Data...Data Warehouse History DWH 该层不在数据仓库设计的范围之内,按照业务新增的数据层,主要储存历史数据。...Data Warehouse Exception DWE 该层不在数据仓库设计的范围之内,按照业务新增的数据层,主要储存异常数据。...Enterprise Data Warehouse EDW 作为企业唯一的数据仓库,EDW提供统一的数据服务,查询结果有效一致。数据设计支持跨部门,支持海量数据,并支持大量的查询请求。...生产报表,也支持adhoc查询,数据反范式设计。 Data Lake Database DLD 该层存储非加工数据,比如日志、视频等,以后结构化数据,并且不分类,没有为了特定程序进行设计和加工。

1.8K00
您找到你想要的搜索结果了吗?
是的
没有找到

-数据仓库架构的设计

数据仓库架构 数据仓库的核心功能从源系统抽取数据,通过清洗、转换、标准化,将数据加载数据仓库中,通过后续加工到BI平台,进而满足业务用户的数据分析和决策支持 ?...平台分为二大类:联机事务处理OLTP(on-line transaction processing)、联机分析处理OLAP(On-Line Analytical Processing),OLAP是为数据分析而设计的数据库管理系统...BI应用程序的体验也是衡量数据仓库是否成功的主要因素。...数据仓库架构图 ? ? 数据仓库平台逐步从BI报表为主到分析为主、到预测为主、再到操作智能为目标。 ?...数据仓库在系统中得定位 数据仓库系统的作用: 能实现跨业务条线、跨系统的数据整合, 为管理分析和业务决策提供统一的数据支持。

1.3K20

数据仓库中的模型设计

个人感觉,很多模型的设计都在同构化,而且在工作中也不是单独地用一种模型,会根据业务场景做出各种取舍。...一、范式模型 范式是数据库逻辑模型设计的基本理论,一个关系模型可以从第一范式到第五范式进行无损分解。在数据仓库的模型设计中目前一般采用第三范式。...我们提到的范式模型由数据仓库之父 Inmon 提倡 ,可以大致地按照OLTP设计中的3NF来理解,它在范式理论上符合3NF,它与OLTP系统中的3NF的区别在于数据仓库中的3NF上站在企业角度面向主题的抽象...三、Data Vault Data Vault 是 Dan Linstedt 发起创建的一种模型方法论,现在应该叫做Data Vault 2.0了,它也是一套完整的数据仓库理论,其中也有专门的一部分关于数据模型设计...关于数据模型,个人感觉在实际的场景中会有很多个性化的设计,有时候还不得不做一些反模式的设计。模型很重要,业务场景也很重要。

2.3K20

Greenplum 实时数据仓库实践(2)——数据仓库设计基础

2.4.3 数据集市设计 2.5 数据仓库实施步骤 2.6 小结 本篇首先介绍关系数据模型、多维数据模型和Data Vault模型这三种常见的数据仓库模型和与之相关的设计方法,然后讨论数据集市的设计问题...2.5 数据仓库实施步骤 实施一个数据仓库项目的主要步骤是:定义项目范围、收集并确认业务需求和技术需求、逻辑设计、物理设计、从源系统向数据仓库装载数据、使数据可以被访问以辅助决策、管理和维护数据仓库...在数据仓库设计的初始阶段,需要确定数据源有哪些、数据需要做哪些转换以及数据的更新频率是什么。 3. 逻辑设计 定义了项目的范围和需求,就有了一个基本的概念设计。...下面就要进入数据仓库的逻辑设计阶段。逻辑设计过程中,需要定义特定数据的具体内容,数据之间的关系,支持数据仓库的系统环境等,本质是发现逻辑对象之间的关系。...实施一个数据仓库项目的主要步骤是:定义范围、确认需求、逻辑设计、物理设计、装载数据、访问数据、管理维护。

1.7K30

数据仓库(07)数仓规范设计

规范设计在这里取《大数据之路:阿里巴巴大数据实践》中的定义,这里记录一下本人对这一块自己的理解。...一般的规范设计包含一下几个方面:划分和定义数据域、业务过程、维度、度量 原子指标、修饰类型、修饰词、时间周期、派生指标。 数据域:指面向业务分析,将业务过程或者维度进行抽象的集合。...需要数据仓库资料可以点击这个领取数据仓库(13)大数据数仓经典最值得阅读书籍推荐 参考资料:数据仓库(01)什么是数据仓库,数仓有什么特点数据仓库(02)数仓、大数据与传统数据库的区别数据仓库(03)...数仓建模之星型模型与维度建模数据仓库(04)基于维度建模的数仓KimBall架构数据仓库(05)数仓Kimball与Inmon架构的对比数据仓库(06)数仓分层设计数据仓库(07)数仓规范设计数据仓库(...08)数仓事实表和维度表技术 数据仓库(09)数仓缓慢变化维度数据的处理数据仓库(10)数仓拉链表开发实例数据仓库(11)什么是大数据治理,数据治理的范围是哪些数据仓库(12)数据治理之数仓数据管理实践心得数据仓库

45930

一篇文章搞懂数据仓库数据仓库规范设计

目录 一、为什么要进行规范设计?...二、设计规范 - 指标 三、命名规范 - 表命名 3.1 常规表 3.2 中间表 3.3 临时表 3.4 维度表 四、开发规范 五、流程规范 ---- 一、为什么要进行规范设计? 无规矩、不方圆。...一个良好的规范设计,应当起到以下作用:提高开发效率,提升质量,降低沟通对齐成本,降低运维成本等。...下面小编将带领大家盘一盘数据仓库有哪些规范,从中挑选几个重点细说: 设计规范             逻辑架构、技术架构、分层设计、主题划分、方法论  命名规范             各层级命名、任务命名...有没有检查分区键值为NULL的情况11DQC质量监控规则是否配置,严禁棵奔12代码中有没有进行适当的规避数据倾斜语句13Where条件中is null语句有没有进行空字符串处理 五、流程规范 根据阿里流程规范,本文将数据仓库研发流程抽象为如下几点

65220

数据仓库(06)数仓分层设计

目前主流的数据仓库分层大多为四层,也有五层的架构,这里介绍基本的四层架构。 分别为数据贴源层(ods)、数据仓库明细层(dw)、多维明细层(dws)和数据集市层(dm)。   ...数据仓库明细层(dw):这一层存放的是一致的、准确的、干净的数据,即对源系统数据进行了清洗(去除了杂质)后的数据。一层一般来说是按照维度建模抽取的明细数据。通常是星形或雪花结构的数据。...需要数据仓库资料可以点击这个领取数据仓库(13)大数据数仓经典最值得阅读书籍推荐 参考资料:数据仓库(01)什么是数据仓库,数仓有什么特点数据仓库(02)数仓、大数据与传统数据库的区别数据仓库(03)...数仓建模之星型模型与维度建模数据仓库(04)基于维度建模的数仓KimBall架构数据仓库(05)数仓Kimball与Inmon架构的对比数据仓库(06)数仓分层设计数据仓库(07)数仓规范设计数据仓库(...08)数仓事实表和维度表技术 数据仓库(09)数仓缓慢变化维度数据的处理数据仓库(10)数仓拉链表开发实例数据仓库(11)什么是大数据治理,数据治理的范围是哪些数据仓库(12)数据治理之数仓数据管理实践心得数据仓库

60720

数据仓库专题(3)-分布式数据仓库事实表设计思考

一、前言   最近在设计数据仓库的数据逻辑模型,考虑到海量数据存储在分布式数据仓库中的技术架构模式,需要针对传统的面相关系型数据仓库的数据存储模型进行技术改造。...设计出一套真正适合分布式数据仓库的数据存储模型。 二、事实表设计基础       事实表记录发生在现实世界中的操作型事件,其所产生的可度数值。...事实表的设计完全依赖于物理活动,不受可能产生的最终报表的影响。事实表中,除数字度量外,事实表总是包含外键,用于关联与之相关的维度,也可以包含退化的维度键和日期/时间戳。...三、传统模式   以FS-LDM数据存储模型Event主题域数据存储模型设计为例,其事件主题域数据逻辑模型结构如下图所示: ?    ...分布式数据仓库设计,恰恰相反,因为单表数据规模的问题,如果要满足分析和处理的性能,合理的按照业务进行数据的分表存储。如财务相关事件、账户相关事件,单独成表。更有利于数据的计算和分析。

93830

数据仓库实践之业务数据矩阵的设计

0x00 概述 数据仓库设计不能完全依赖于业务的需求,但又必须服务于业务的价值。那么,该如何地从业务的角度出发,设计一套切实可行的数据仓库呢?...本文将分享数据仓库实践中的业务数据矩阵的设计经验,帮助大家在工作中快速理解业务并规划数据仓库体系。...一般来讲,在数据仓库设计初期,数据仓库架构师会根据对业务和数据的理解来设计一个全局的业务数据矩阵,以此从宏观的角度来描述公司的业务和数据现状,并指导后续的数据仓库建模。...简单来讲: 能够帮助数据仓库架构师清晰地梳理整个数据体系。 能够帮助决策者(各位老板)从宏观的角度了解数据仓库的整体情况。...能够让所有的数据仓库参与者了解数据仓库设计,根据矩阵有规划地填充数据表即可。 0x02 举个栗子 趁热打铁,居士举一个栗子来说明业务数据矩阵的设计

2K31

关于【你们数据仓库是怎么设计的】如何回答?

你们数据仓库都是怎么设计的,数据怎么抽象? 关于这个问题,我说一说我的想法,不一定是正确的,但希望能给你提供一些思路 1、数据仓库是怎么设计的? 如果真的要完全回答这个问题,真的太大了。 ?...可以按照自己的习惯,把数仓怎么设计的分成几个模块,比如: 技术架构 数据流转 分层建模 然后,询问一下,面试官重点想要听哪一块?...分层建模: 这块主要讲公司目前仓库的分层,每一层的作用,有哪些基础数据,讲一下自己对目前公司仓库设计的一些看法,好的地方,不好的地方。不好的地方,需要怎么改进。...另外还可以讲一讲,自己的一些设计比较巧妙的模型,比如留存,留存的设计可以依据业务需求,从易到难,有多种设计。....等等 维度建模,星型模型,这么多年了,都是这些,也没什么创新,如果只讲这些,会让人觉得耳朵都起茧子了,可以把这些融合到实际案例中,多讲自己的思考和感悟,平时工作中也要细心观察,现在没有任何一家公司的数据仓库是完美的

75570

数据仓库设计和规范—数仓分层和规范

抽取规则和策略说明 ①.ODS设计 抽取周期日抽取条件每日全量,基于create_time或者是update_time字段进行数据抽取 ②.数据源和ods的对应 列名描述来源转换规则安全等级user_id...加工规则和策略说明 ①.DWS设计 加工周期日加工条件每日增量,基于create_time进行数据加工 ②.数据源和dwm的对应, 是基于dwm层数据 列名描述来源转换规则安全等级user_id用户主键...加工说明 ①.DWA设计 加工周期日加工条件每日增量,基于分区字段进行数据加工 ②.数据源和dws层对应,视图方式 列名描述来源转换规则安全等级user_id用户主键user_id create_time...维表设计开发     1. 维表设计字段冗余,为了使用时字段的全表扫描,采用列存储方式;     1. 针对缓慢变化维,保留历史数据和版本TTL为30天, 方便数据追踪,后续统一使用新的维表。 三....背景说明 完成数据仓库的分层后,针对各层次的数据之间的调用关系作出约定。 二. 调用规范          ①.

4.6K23

数据仓库①:数据仓库概述

注:如果您还不清楚完整参照性约束,请参考《数据库关系建模》 :,如果您还不了解范式,请参考《更新异常与规范化设计》 。...数据仓库(data warehouse)定义 聪明的读者应该已经意识到这个问题:既然分析型数据库中的操作都是查询,因此也就不需要严格满足完整性/参照性约束以及范式设计要求,而这些却正是关系数据库精华所在...~这就是关于数据仓库最贴切的定义了。事实上数据仓库不应让传统关系数据库来实现,因为关系数据库最少也要求满足第1范式,而数据仓库里的关系表可以不满足第1范式。...有了这些数据快照以后,用户便可将其汇总,生成各历史阶段的数据分析报告; 数据仓库组件 数据仓库的核心组件有四个:各源数据库,ETL,数据仓库,前端应用。如下图所示: ? 1....数据仓库开发流程 在数据库系列的第五篇 中,曾详细分析了数据库系统的开发流程。数据仓库的开发流程和数据库的比较相似,因此本文仅就其中区别进行分析。 下图为数据仓库的开发流程: ?

2.8K71

模型设计(数据仓库、星型、雪花型、星系模式)

1.数据仓库 数据仓库是多维数据库,它扩展了关系数据库模型,以星形架构为主要结构方式的,并在它的基础上,扩展出理论雪花形架构和数据星座等方式,但不管是哪一种架构,维度表、事实表和事实表中的量度都是必不可少的组成要素...采用星形模式设计数据仓库的优点是由于数据的组织已经过预处理,主要数据都在庞大的事实表中,所以只要扫描事实表就可以进行查询,而不必把多个庞大的表联接起来,查询访问效率较高,同时由于维表一般都很小,甚至可以放在高速缓存中...5.数据集市 数据集市是在构建数据仓库的时候经常用到的一个词汇。...数据集市面向企业中的某个部门(或某个主题)是从数据仓库中划分出来的,这种划分可以是逻辑上的,也可以是物理上的。...数据仓库由于是企业范围的,能对多个相关的主题建模,所以在设计其数据构成时一般采用星系模式。

1K30

一篇文章搞懂数据仓库:维度表(设计原则、设计方法)

2、维度表设计原则 (1)维度属性尽量丰富,为数据使用打下基础 (2)给出详实的、富有意义的文字描述 (3)区分数值型属性和事实 (4)沉淀出通用的维度属性,为建立一致性维度做好铺垫 (5)退化维度(DegenerateDimension...) (6)缓慢变化维(Slowly Changing Dimensions) 3、维度表设计方法 ---- 1、什么是维度表?...维度的作用一般是查询约束、分类汇总以及排序等,我们在进行维度表设计时,应当提前考虑: (1)维度属性尽量丰富,为数据使用打下基础 比如淘宝商品维度有近百个维度属性,为下游的数据统计、分析、探查提供了良好的基础...③ TYPE3 增加属性列 3、维度表设计方法 第一步:选择维度或新建维度。作为维度建模的核心,在企业级数 据仓库中必须保证维度的唯一性。以淘宝商品维度为例,有且只允许有 一个维度定义。...数据仓库是业务源系统的数据整合,不同业务系统或者同 一业务系统中的表之间存在 关联性。根据对业务的梳 理,确定哪些表和主维表存在关联关系,并选择其中的某些表用于生成维度属性。

1K20

微信万亿数据仓库架构设计与实现

然而,微信安全数据仓库不仅仅是一个存储中心,更是一个特征管理和数据质量管理的中心。在演进过程中,数据仓库一直致力于提升特征管理能力和数据质量保障,实现了特征的管理、共享、分析和数据质量检测等功能。...本文将介绍安全数据仓库的起源、演进、当前的架构设计和数据质量保证系统的实现。 业务背景 安全策略开发流程 安全业务的核心逻辑在安全策略中实现。...架构设计和演进 统一存储统一接口 数据仓库第一个版本,针对特征存储分散访问接口混乱问题,首先部署了公共的实时KV/离线KV集群,并实现了一个接入层。...替代分布式队列:前一个版本中分布式队列采用的是公共的集群,众多业务使用,出现过数据仓库受干扰影响特征数据同步。 为此在数据仓库中新增一个异步消息队列模块写MQ,用于异步写入。...为了保障离线特征数据的质量,数据仓库设计了一套空跑系统,在上线前对数据文件进行检查,避免存在问题的数据上线到现网。

29020

全栈设计师技术Wiki之数据仓库

数据仓库 DataWarehouse : 简称为 DW 或 DWH ,是决策支持系统( dss )和联机分析应用数据源的结构化数据环境,最早由比尔·恩门( Bill Inmon )于 1990 年提出。...如何理解数据仓库? 我们可以从企业数据处理的两大类任务来理解数据仓库: 一类是操作型处理,它是针对具体业务在数据库的日常操作,通常对数据库记录进行查询、修改。...由于历史数据非常大量,同时也存在历史数据来源不一、格式不一的情况,需进行数据清洗、挖掘等操作,这时候普通的数据库查询已经无法满足需求,数据仓库就是为了解决此类问题而被提出的。...数据仓库设计语言 在用户体验设计领域,数据仓库类似于设计语言,为了解决企业或平台产品众多的设计需求,统一设计标准,为每一次的设计需求提供“设计决策”支持。

63760
领券