专栏首页CloudBest三问数据中台:是什么?怎么做?为什么要做?

三问数据中台:是什么?怎么做?为什么要做?

自从阿里提出了“大中台,小前台”概念之后,这几年数据中台这个概念火了起来,互联网巨头们纷纷搭建起了自家的数据中台,究竟数据中台有什么魅力,能让企业如此重视?

什么是数据中台?

很多人会问,到底什么是数据中台?

通俗地讲,数据中台就是一个在数据层面上为企业业务提供帮助、决策的一个工具。

在以前,数据往往只被显示,不被存储;慢慢地,人们需要随时随地查找数据,存储数据的概念被普遍认知;再慢慢地,人们渐渐产生了数据思维,发现可以通过观看数据来制定运营策略;当互联网时代进入了爆发期,此时产生了大量的数据,人们通过数据挖掘,收集大量的外界数据作为决策的依据。

而如今,互联网已步入一个较为成熟的时期,大公司纷纷去打造自家的数据中台,将海量的数据作为自身的资产,并擅于利用数据中台将数据进行整合、智能分析,以数据驱动决策。

说到数据中台,又会牵扯到数据仓库,很多人一看,数据仓库?不就是数据库嘛,存储数据的东西,其实这是不太正确的认识,那这两者的区别又是什么呢?

01

面向的业务场景不同

数据仓库主要是将收集到的数据进行分析、处理;

而数据库主要是面向事务的处理;

02

侧重优化数据方式不同

数据仓库主要集中资源去优化资源的获取方式,因为业务人员、运营人员对于数据的获取需求是非常大的,往往每天都有大量的数据会被调用、获取以及处理;

而数据库主要集中资源对增、删、改、查等等方面的功能进行优化,防止过多的数据更新和事务影响数据库的效率和稳定性;

03

数据的组织方式不同

数据仓库往往是以时间来进行组织数据,以电商订单为例,数据仓库分别会以“1小时订单”、“1日的订单”、“1个月的订单”组织好数据分析表,方便业务人员获取分析;

而数据库则是以索引和实体内容来组织数据,例如“数码产品订单”、“生鲜订单”、“服装订单”等等将不同的数据表进行组织;

04

冗余性不同

数据仓库往往是高冗余的,因为数据仓库希望借助更多重复类型的数据去分析整个产品的运营走势,为下一步的运营决策做依据;

而数据库往往是低冗余的,数据库不希望存储大量重复类型的数据,从而影响数据库整体的性能效率;

谈到这里,大概对数据中台有初步的了解,那接下来看看我们如何去搭建一个最适合自己公司的数据中台吧。

如何搭建最合适自己的数据中台?

为什么要说是“最适合”自己的数据中台呢?

数据中台无论是功能、逻辑都是非常的复杂,其中涉及到的字段、维度非常的多,那如何打造最适合自己的数据中台呢?可以这样去思考:

1

先分析需要什么数据

首先必须根据自身业务出发,去分析到底我们需要什么数据?下面是例子:

1

电商业务

电商,离不开订单、商品、支付等等这些数据,就订单数而言,就可以拆分这几个维度进行统计:分/时/日/周/月订单数、人均订单数、男性/女性用户订单数、服装/数码产品订单数、复购订单人数、订单销售额 、订单成交率、订单退换率等等;

如果是商品,又会涉及到商品种类成交数、商品点击率、商品评价数等等;

如果是支付,则会涉及到支付成功/失败率,支付次数、支付渠道、支付优惠使用率等等。

2

直播业务

谈到直播业务,核心角色可分为主播和用户,整个直播平台就是围绕着这两大核心角色进行设计的。

简单的说,直播就是主播和用户进行信息交换的一个过程,主播提供内容,用户消费内容,反馈信息(发送弹幕,赠送礼物等等,当然用户也可以不做任何操作,但也为主播提供了人气和观众数);

可以分析整个直播流程就是:主播打开直播间——用户收到推荐/订阅提醒/搜索/首页推荐等等方式进入了直播间——主播与用户进行信息交换、互动——用户退出直播间/主播下播——直播流程结束。

那么从这一简单的流程中,我们就可以挖掘出许多的数据指标,例如:开播1分钟/小时观众数、消息推送/订阅/首页推荐点击率、搜索次数、弹幕发送次数/率、送礼种类/数量、观看直播1/5/10…分钟的用户数、各种留存率等等,由于数据指标过多,暂先列出以上数据。

3

出行业务

出行业务,我们也是根据业务流程去分析:用户提交订单——司机接单——用户上车,司机确认,订单开始——到达目的地,司机确认,用户下车——用户支付(自行决定是否评价)——订单流程结束。

根据流程,我们可以继续挖掘数据指标,例如:某区域内1小时内订单发起数、司机一天接单数、平均订单金额、订单取消数/率、订单公里数、某区域订单平均响应时间、订单好评/差评率等等。

因此要分析需要什么数据,必须切实地从自身业务的流程一步步去拆解出各个指标数据。

2

如何落地中台开发

1

明确需求

当明确自身需要什么数据后,此时可以与业务、运营人员进行沟通,他们需要什么样的数据,需要怎样组合数据,呈现方式是什么,是否支持导出数据等等,都需要产品经理与业务方进行详细地沟通,明确每一个需求,才能算是前期工作准备的良好开头。

2

原型设计

当明确需求后,就可以开始进行原型设计了,这里就涉及到了设计的细节:如何让数据可视化更清晰?如何让操作更加简便,业务人员更容易上手?

因此在设计的过程中,除了跟开发保持沟通,同时还需要跟业务人员保持一定的联系,防止原型设计好,业务人员不满意又要大改。

3

需求评估,跟进开发进度

当设计好原型和撰写好需求文档后,就可以进行需求评估了,这个阶段如果出现难以实现的功能,那产品和开发就要共同去想如何换另一种设计方式去解决同样的问题;

然后还有就是进行需求排期,大概确定每一个时间节点,产品经理时刻跟进开发进度。

4

开发完成,严格测试

可能大家会想,中台又不是给C端用户用,测试那么严格没必要;但正是因为中台不是给用,而是给业务人员用,如果出现了数据上的严重纰漏,影响了运营的决策,那么带来的业务影响也是非常严重的,因此严格的测试必不可缺。

5

成功上线,时刻跟进问题

测试结束后,终于可以上线了,然而重头戏才刚刚开始,此时会发现,业务方使用了中台后向你提出各种各样之前测试测不出来的bug,此外,还会吐槽功能的各种不好用,甚至给你提另外的需求……

作为中台产品经理的你,此时可能会感觉压力非常的大,但只要我们时刻保持跟进,合理安排项目进度,解决需求,我想,业务同学也不会刻意去为难你。

为什么大公司需要自建数据中台

据调研发现,其实市面上已经存在不少如“神策数据”、“BDP”、“帆软”等等的第三方智能数据平台,企业购买即可使用,那相当于已经有现成的了,为什么还要大费周章去自己开发呢?

我想,可能是因为这些原因:

1

数据安全性

对于大公司来说,他们拥有的数据是海量的,海量的数据里面往往存在着许多商业价值极高的数据,简称商业机密,是不能泄露到外界去的,因此自家研发的平台能够保障一定的安全性。

2

数据即资产

数据对于企业来说,就是资产,尤其在大公司,数据就是运营决策的依据,若被竞争对手得知了数据,提前判断到对方的下一步运营策略,万一在某一重要节点的活动中竞争失败,对于企业来说则是遭受非常大的损失。

3

成本可控性

第三方数据平台往往是根据付费价格来区分服务质量的,如果想要享受到更多更好的服务,必须提高支付的费用,如果需要定制化方案,成本会变得更高;、

如果采用自建平台,首先开发什么功能,调用多少资源都可以自己决定,对于成本有一定的把控能力,同时,如果后期扩展功能,也会更加地方便。

4

组合多样性

由于用户的需求种类繁多,因此业务人员提的需求往往存在个性化特征,例如需求以报表形式呈现,报表由各种指标组成,指标与指标之间形成了多对多关系,指标之间互相关联,那么这种多样化指标是第三方平台无法满足的,因此自建的平台就能体现它的作用了。

当互联网的红利逐渐消失,如何利用数据智能化运营将会是每一家企业的重要任务,运营人员的能力固为重要,但拥有一个好中台,会让你的运营走得更加顺畅。(来源:人人都是产品经理)

本文分享自微信公众号 - CloudBest(iyunshangjie)

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2019-11-12

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 到底什么是移动边缘计算?

    CloudBest
  • 从CMDB到数据中台

    2018年年底到2019年年初,一场组织变革的飓风席卷了国内各大互联网公司。阿里、腾讯、百度、京东、美团等先后拿出了几年来最大规模的组织调整计划。在这些变化中,...

    CloudBest
  • 什么是数据中台?全面解读数据中台

    伴随着云计算、大数据、人工智能等IT技术迅速发展及与传统行业实现快速融合,一场由数字化和智能化转型带来的产业变革正在孕育。

    CloudBest
  • 今天处理的三个小问题——20160120(r7笔记第84天)

    今天处理了几件事情,有几件还比较有意思,我拿出三件来说说。 首先是早上有一个同学打电话求助一个问题,给我的反馈是他们目前有一个表,数据量越来越大,目前数据插入变...

    jeanron100
  • 大数据周周看 | 两家大数据公司成功挂牌新三板,企业+政府+高校 跨界合作已成潮流

    <数据猿导读> 近年来,随着大数据技术的飞速发展,政府、企业、高等院校之间合作的事情屡见不鲜,很多企业都选择与政府或是高校联合建立大数据中心、投资大数据产业项目...

    数据猿
  • .NET/ASP.NETMVC 深入剖析 Model元数据、HtmlHelper、自定义模板、模板的装饰者模式(一)

    阅读目录: 1.开篇介绍 2.Model与View的使用关系(数据上下文DataContext与View呈现) 3.Metadata元数据驱动设计(如何使用中间...

    王清培
  • 【学术】一文带你了解深度学习中新衍生的技术——视觉问答(VQA)

    AiTechYun 编辑:Yining 从某些角度上来看,建立一个能够回答自然语言问题的系统一直被认为是一个非常有野心的目标。根据下面给出的图像,想象一个可以回...

    AiTechYun
  • 大数据让未来生活充满无限可能,未来可能不用苦苦学外语了

    初中开始接触摄影,从胶片相机玩到数码单反,今年28岁的的陈伟一直是身边朋友公认的摄影大师,“对于摄影最前沿的东西没有不知道的。”但在近日举行的生态文明贵阳国际论...

    小莹莹
  • 数据分析—产品经理的另一项硬技能

      大家都知道,对于产品经理的岗位要求的能力还是比较多的,如果我们对这些能力,按照硬技能和软技能进行分类的话,就有且不止以下这些能力:   软技能:沟通能力、...

    小莹莹
  • TED演讲-数据科学家最重要的技能是什么

    对于数据科学家来说,最重要的技能究竟是什么呢?在本期的TEDx演讲中,你一定会找到相应的答案。

    CDA数据分析师

扫码关注云+社区

领取腾讯云代金券