本文是【技术琐话公益直播】4月28日晚分享嘉宾徐桢虎在线直播中主题《数据中台初探与应用实践》内容整理,内容有删减调整,直播回放见之前的分享。
当企业发展到一定规模时,数据是否能够创造价值显得尤为重要。如果没有从业务的角度对数据进行规划,再多的数据也没有用。一个企业业务与数据双中台的战略地位是相辅相成的,需要打造数据与业务的闭环。
数据中台的核心价值为优化现有业务和实现新业务的转型,打造数据驱动的智能化企业。
业务价值 :
技术价值 :
传统数据仓库,第一次明确了数据分析的应用场景应该用单独的解决方案去实现,不再依赖于业务的数据库。这个阶段主要是IBM、oracle的产品的黄金年代。但是进入互联网时代后业务发展太快,数据量剧增,传统数据仓库逐渐没落。为什么传统数据仓库效率这么低?自顶向下建模。
数据湖(Data Lake)是一个以原始格式存储数据的存储库或系统。以google发布的三篇论文为基础实现的hadoop开源项目的出现大数据平台是面向数据研发场景的,覆盖数据研发的完整链路的数据工作台。
大数据平台像一条设备流水线,经过大数据平台的加工,原始数据变成了指标,出现在各个报表或者数据产品中。
数据中台的核心,是在企业数字化战略的基础上,利用一套技术标准构建的共享、安全、标准、统一的数据服务。
恩门建模(自顶向下)因为是从数据源和主题域开始构建,构建成本比较高,适用于应用场景比较固定的业务,比如金融领域,冗余数据少是它的优势。金博尔建模(自底向上)由于是从分析场景出发,适用于变化速度比较快的业务,比如互联网业务。
嘉宾观点:数据中台是各个企业独有的一种战略选择和组织形式,不存在数据中台这样的一个能对外直接售卖的产品。
嘉宾认为:
企业有一定的信息化基础,但存在较多的业务数据的孤岛,需要数据整合分析
企业有数字化转型需求,需要通过精细化运营提升效率
企业是跨多个领域业务线的集团架构,有丰富的标签维度和大量的数据应用场景
四、什么时候要建数据中台
五、建设数据中台的成本
六、如何建数据中台
嘉宾观点:可见是数据资产化,可用是数据产品化和服务化,可运营是要打造数据价值转换的闭环
建议原则:
尽量兼容原各业务线系统,避免推倒重来(开源兼容)
先拿新的业务线作为试点,再大面积推广(快速试错)
先使用的业务线,提供更高的容错度和激励(鼓励创新)
嘉宾核心观点
人的因素往往最难推动,因为涉及到很多团队的利益,还涉及到能不能找到一些有经验的人来做这个事情。
嘉宾介绍:
徐桢虎,西南交通大学计算机硕士,专业方向是数据仓库与数据挖掘
封面传媒 总经理助理兼数据研究部总监
技术委员会召集人、人工智能研究所执行所长
专注领域:数据中台建设、媒体AI应用落地
TGO鲲鹏会 成都分会成员
2050大会讲师
四川省青联委员
领取专属 10元无门槛券
私享最新 技术干货