首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >#凯哥讲数据中台#数据中台建设成功的三个阶段

#凯哥讲数据中台#数据中台建设成功的三个阶段

作者头像
凯哥
发布2020-02-19 16:15:51
1K0
发布2020-02-19 16:15:51
举报

导读

欢迎转载,请注明出处

前言:

自从数据中台爆火以后,天天有人问如何度量数据中台建设的效果,怎么证明数据中台建设就成功了。

这是一个很复杂的问题,就好像问,如何证明企业数字化转型成功了一样。

ThoughtWorks数据智能团队认为,让企业的数据“用起来,跑起来,转起来”是企业数据中台构建成功的标准。

一个典型的B2B2C企业的数据中台案例

下面 这个案例是一个典型的企业构建数据中台利用数据,挖掘数据价值的过程,利用这个案例,我们来看一下如何从无到有构建一个数据中台。

数据应用的挑战

这个企业是一个传统行业,他们的业务模式是典型的品牌商,经销商,门店,消费者四层结构,是典型的产品加服务的模式,对于门店(客户端)的依赖较大。

以前,该企业靠产品的差异化有极强的竞争力,是典型的卖方市场,运营方式相当传统。

市场大撒钱,活动广告是粗犷式管理。

销售常压货,对经销商是控制型管理。

但是,近几年,该企业所在产业升级,客户的需求越来越多元化,门店对于单个产品的依赖越来越低,经销商压力越来越大,传统的压货模式已经不能够应对现有的模式。为了应对这样的挑战,该企业也做了很多尝试,建立自己的电商平台,打造线下直营店,希望和客户,消费者建立更加直接的联系,应用建的不少,但是依旧面临很大的挑战。

主要包括如下5点:

  1. 市场费用花了不少,不知道都带来了什么效果
  2. 没有客户端端数据,只有Sale In没有Sale Out,不知道谁在用自己的产品
  3. 线上流量无法导到线下产生订单
  4. 线下经销商数据不能回到线上形成闭环
  5. 企业花钱买了流量,但是转化率低

如何解决这些问题呢?

应对挑战的冰山模型

以上的业务现象,从数据的视角都能找到相关的原因:

  • 市场费用花了不少,不知道都带来了什么效果

市场的广告,活动等投资,没有与阅读量,传播量,转化量,销量数据直接关联起来,所以,无法度量和评估效果。

  • 只掌握Sale In(销售给经销商的订单)没有Sale Out(销售给客户和消费者的订单),不知道谁在用自己的产品

传统的经销商代理模式,品牌商获取不到Sale Out数据,所以无法准确的知道市场的真实库存情况,也就无法更准确的做销量预测,更不清楚自己的商品卖给了哪些门店和消费者,这是数据缺失的问题。

  • 线上流量无法导到线下产生订单

由于该行业的特殊性,需要服务的支撑,所以线上直接下单的几率较小,很大程度上依赖线下的沟通。但是线上有用户访问,但是哪些是高潜意向用户,应该如何跟进,分配给那个门店或者经销商比较合适,这些决策缺乏数据支撑,导致线上流量导入线下生成订单的成功率低。

  • 线下经销商数据不能回到线上形成闭环

线下经销商的订单数据,缺乏有效的手段采集回品牌商,从而能够匹配到对应的Sale in数据,无法形成闭环,这样会导致对市场预测,库存,经销商行为,销售能力的不掌握,就无法对于后续的经营做出更加准确的指导。

整个市场竞争越来越激烈,品牌商还是按照抽成的方式在挣钱,并且对中国市场的利润要求还保持一定的增长,这种情况下品牌商的销售部门为了完成任务各种压货,杀鸡取卵,经销商不挣钱,疲于奔命,而经销商的数字化水平普遍比较低,人员流失率大,陷入恶性循环。

  • 企业花钱买了流量,但是转化率低

有些企业意识到了流量的重要性,所以花了大投资在流量上,流量的质量越来越差,转化率很低,归根到底是这些流量的数据与内部的营销数据没有整合起来,导致有质量的流量没有被识别出来。

在这样的情况下,该企业与ThoughtWorks合作,采用精益的方法,从很小的投资做起,分四步走,识别数据场景,将数据先利用起来,构建了企业的数据中台,拉通了企业数据,提高了数据利用的效率,并且一个个的在中台上快速又生长出了数据应用,赋能了更多的企业的业务,最后形成了持续的数据运营体系。

整个这个过程,可以用三个阶段来总结:

让数据,“用起来”,“跑起来”,“转起来”

一、让数据用起来

该企业并没有一上来就做技术平台,而是做了一个轻咨询,首先,从业务价值的角度全面的发散了各种有价值的数据利用场景清单,然后对这些场景进行了价值优先级的排序,选出优先级比较高的场景进行深度分析。探索这些场景需要的数据,验证技术可行性,做一个可行性优先级的排序,最后从这个场景清单中选出最有价值,数据基础最好,技术可行的场景,作为最小可行性产品(MVP)立刻启动交付开发,从而最快的将数据利用起来。

精益数据创新的三个交集

让数据用起来,产生业务价值是数据中台建设的第一优先级。至于这个用起来的过程是否是自动化的,是否有大数据平台的支撑,是否用到了先进的技术,这些都是第二位的事情。

举个例子,作为该企业的经销商,经常会需要产品参数数据,过去这些数据都是通过邮件发出来,所以,很不及时,而且还需要收到后进行手工的处理才能用起来。这个场景在轻咨询中被识别出来,后来,做了一个数据API,让经销商们能够通过这个API去很方便的调用最新的参数数据,而不需要打电话再发邮件了,这就把这个参数数据用了起来。

但是,其实这个需求的技术实现是非常简单的,并不复杂,而且在最早期,甚至还有一些落后,为了快速响应业务的需要,这后台并没有用到多么高深的开发,也不是自动的,而是人工查询、采集、处理好参数数据放到一个文件夹下面,然后在用程序去读取这个文件,连数据库都没有用到。

让数据能够以服务的形式被业务调用,哪怕是手工配置的数据,这就是数据中台的第一个阶段,让数据用起来。

回看企业信息化,很多企业都做了一些第一个阶段的工作,局部的将数据利用了起来,比如,管理驾驶舱,固定报表,多维分析,动态查询,还有一些以数据科学项目形式出现的,比如做一个预测模型,做一个优化算法等。这个阶段的特点是,利用局部的数据,不连续的利用数据,当数据发生变化的时候,要重新执行一遍这个流程。

如何能够自动,按需的让数据为业务提供价值呢?就像软件工程中CD/CI那样,在源数据和数据利用场景之间构建一个自动价值流,让它跑起来。

二、让数据跑起来

数据中台是企业的数据产品工厂,它的作用就是在源数据和数据产品之间构建一个自动的数据处理链,从而让源数据自动的经过采集、处理、转换、集成形成一个个的数据产品(服务),在被相关业务系统所调用。整个这个过程都是在数据中台中的数据价值链中流转的,数据中台让所有的数据产品从生产到消费的过程自动化,形成自动的流,从而让数据跑起来。ThoughtWorks给这个过程起了个名字叫CD4ML,Continuous Delivery for Machine Learning,就是机器学习的持续交付。对应到数据建模,我们也可以叫它CD4DM,也就是Continuous Delivery for Data Modeling。

这里的让数据跑起来,包括几层特定的含义:

一、让数据随时都在跑动

在数据仓库时代,每天晚上要跑一边数据,跑完了数据才是最新的,准确的,是靠定时任务做到的。而在数据中台时代,结合流数据的技术,能做到让数据随时都在跑,保证实时性。数据是真实业务与数字化世界的链接,让数据随时都在跑动,意味着数据实时反应这业务,这也是数字孪生的概念的本质。

二、让数据跑到正确的地方

数据仓库时代,数据可视化报表时数据利用的主要形式,各种数据报表层出不穷。而这些报表是否有人看,使用频率如何,业务用户使用报表的反馈是什么,这些很少被实时的采集和分析。而在这个企业的案例中,数据是按需提供给对应的用户的,并且谁访问了这些数据,都会被记录下来,从而供运营分析使用。所以,让数据跑起来,还包括按需提供个性化的数据给到业务用户,让数据跑到正确的地方,按需产生价值,避免浪费。

让数据跑起来,是数据平台,数据运营平台的功能,通过数据处理链(Data Pipeline)让数据自动的在源系统和数据产品之间快速流动,这是价值流的体现。

三、让数据转起来

当数据能够自动的跑起来,有了持续交付价值的能力后,下一步是什么呢?

形成自学习,自驱动,自演进的价值闭环,通过一个生态体系,让数据价值在这个体系中转起来。

具体体现在如下几点:

数据形成闭环

二次生产加工的数据和源数据是一个体系,相互连接,相互打通,所以能够形成数据闭环。

价值被验证

数据产品的价值在这个闭环中被验证,如果价值不被体现或者达不到预期的效果,则需要优化算法或数据,否则就要被淘汰。

持续运营体系

企业的业务在不断变化,数据是业务在数字化世界里的投影,所以数据也是时刻更新的,所以数据的利用要形成常态机制,能够持续有人负责,有人去挖掘,有人去验证,这就是建立持续数据运营体系的概念。

小结

让数据“用起来,跑起来,转起来”,对应的就是数据应用体系,数据技术体系和数据运营体系。

企业必须建立起这三个体系,才能构建数据驱动的能力。

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2020-01-27,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 凯哥讲故事系列 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 前言:
  • 一个典型的B2B2C企业的数据中台案例
    • 数据应用的挑战
      • 应对挑战的冰山模型
        • 一、让数据随时都在跑动
        • 二、让数据跑到正确的地方
    • 一、让数据用起来
    • 二、让数据跑起来
    • 三、让数据转起来
      • 数据形成闭环
        • 价值被验证
          • 持续运营体系
            • 小结
            相关产品与服务
            腾讯云 BI
            腾讯云 BI(Business Intelligence,BI)提供从数据源接入、数据建模到数据可视化分析全流程的BI能力,帮助经营者快速获取决策数据依据。系统采用敏捷自助式设计,使用者仅需通过简单拖拽即可完成原本复杂的报表开发过程,并支持报表的分享、推送等企业协作场景。
            领券
            问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档