前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >数据中台体系结构、建设方法和落地实践(2):数据中台的概念定义

数据中台体系结构、建设方法和落地实践(2):数据中台的概念定义

作者头像
数据饕餮
发布2020-07-30 16:58:16
6520
发布2020-07-30 16:58:16
举报
文章被收录于专栏:数据饕餮数据饕餮

一、前言

关于数据中台的概念定义,业内有各种各样的版本,尤其是涉及数据中台与数据仓库、数据平台等相关概念的差异一直争议不断,可谓一百个人眼中,就有一百个数据中台,千百万人眼中,就有千百万个数据中台。关于概念之争论,笔者无意逐一罗列,更无意参与其中,而是希望从工程实践者的视角,提供一种全新的关于数据中台定义的思考逻辑。本章内容围绕数据中台的定义,采用两种方法,三个视角,给大家阐述,在工程实践者的眼中,数据中台的概念定义。

二、正文

2.1 什么是数据中台

数据中台概念的理解,我们可以通过拆解其建设内容和知识结构进行理解,此为归纳法。数据中台是一个系统工程,不仅是一个单纯的产品&技术的问题,同时也涉及到企业战略、组织架构等诸多方面。通过抽象与概况,我们可以把数据中台的建设相关的因素,抽象为人和事两个方面。人的层面是数据中台组织;事的方面则包括:数据应用、工具平台、数据仓库和基础平台四大部分。基于建设内容视角,数据中台的概念定义如下图所示:

2.2 数据中台的演进路线

数据中台的演进路线,我们引入时间维度和数据生命周期维度,来看一下服务于业务的、全局统一的、数据服务体系的发展和演进路线。完整的演进路线如下图所示:

上图中,横轴代表时间,自左到右,代表出现的先后顺序,依次为:数据仓库、数据平台和数据中台;纵轴代表数据的生命周期,依次为:数据内容、数据存储和计算、数据建模、数据服务和数据应用。基于以上二维矩阵的对比分析,我们发现:

数据仓库的重心在于数据建模,对于原始数据内容进行重组和融合,生成基于数据主题的存储和分析模型;数据平台的在数据内容和存储计算能力上进行了拓展,基于分布式存储和分布式计算问题,解决了数据存储和计算的瓶颈,同时引入了非结构化数据和半结构化数据,具备了全量数据存储和全量数据计算的能力;数据中台继承了数据仓库和数据平台全部内容,着重强调了数据服务环节的全局统一性特征。

通过以上时间和数据生命周期两个维度,进行数据仓库、数据平台和数据中台的对比和分析,我们可以得出归纳两个结论:一、时间视角:数据中台是数据仓库、数据平台发展和演进的下一个阶段;二、数据视角:数据仓库、数据平台和数据中台,各自强调了数据生命周期的某些环节,是对过往问题和瓶颈的一次突破和提升,但是其作为面向业务的、全局的、数据服务体系本质没有变化。

三、未完待续

计划写一个完整的关于数据中台的系列文章,此为第二篇,基于工程实践视角阐述数据中台的概念定义和演进路线。下一篇:《数据中台的体系结构》,敬请期待。沟通交流,共同学习,可以加交流群:

本文参与 腾讯云自媒体分享计划,分享自作者个人站点/博客。
原始发表:2020-07-30 ,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 一、前言
  • 二、正文
    • 2.1 什么是数据中台
      • 2.2 数据中台的演进路线
      • 三、未完待续
      相关产品与服务
      对象存储
      对象存储(Cloud Object Storage,COS)是由腾讯云推出的无目录层次结构、无数据格式限制,可容纳海量数据且支持 HTTP/HTTPS 协议访问的分布式存储服务。腾讯云 COS 的存储桶空间无容量上限,无需分区管理,适用于 CDN 数据分发、数据万象处理或大数据计算与分析的数据湖等多种场景。
      领券
      问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档