前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >【知识】数仓的技术框架和意义

【知识】数仓的技术框架和意义

作者头像
辉哥
发布2021-03-04 10:31:02
5110
发布2021-03-04 10:31:02
举报
文章被收录于专栏:区块链入门

一、数仓的意义

二、数据体系

  1. 数据体系构成

在这里插入图片描述

  1. 常见技术架构 偏离线:适用于业务初期,迅速形成数仓雏形,快速交付满足业务

在这里插入图片描述 离线+实时:适合业务中后期,形成扩展性极强的技术架构

在这里插入图片描述 偏实时:适合特殊业务,例如:广告、风控

三、数仓分层

数仓分层&主题 数据缓冲层:数据暂存区,只保留每天的增量数据 数据明细层:全量数据区,采用全量表、快照表、拉链表等保存全量数据,并做基础数据的归一化处理和模型的拆解、合并,多采用ER建模 数据衍生层:数据聚合区,多用于轻度汇总以及衍生计算,产出标准化数据,屏蔽上游业务变更对下游的影响。 数据集市层:数据集成区,基于角色+场景构建场景化数据模型。 数据应用层:数据交付区,提供数据服务以及数据产品的数据。

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 一、数仓的意义
  • 二、数据体系
  • 三、数仓分层
相关产品与服务
数据集成
数据集成(DataInLong)源于腾讯开源并孵化成功的 ASF 顶级项目 Apache InLong(应龙),依托 InLong 百万亿级别的数据接入和处理能力支持数据采集、汇聚、存储、分拣数据处理全流程,在跨云跨网环境下提供可靠、安全、敏捷的全场景异构数据源集成能力。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档