首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

多维数据分析(OLAP)技术选型(2):数据分析与OLAP差异

此文主要是跟大家聊聊数据分析与 OLAP 差异,只有清晰它们之间差异,我们才可以深入了解所选型技术使用场景,脱离使用场景的技术选型就如无源之水,无本之末;对技术使用场景认知程度,决定了我们所选择的解决方案;如“盲人摸象”的例子,如果你只摸到了象的耳朵,那么你的解决方案就是拿一个筐,把耳朵拎走。如果你摸到的是整头大象,你的解决方案就会是集装箱,用卡车把它运走。但是如果你摸到了整个象群,你的解决方案可能是修桥、修路。

你的世界有多大,在于你发现的世界有多大,然后你的解决方案就有多大。

因此,为了选择一套符合我们业务场景的 OLAP 技术,我们要先深入了解 OLAP 使用场景---数据分析。

什么是数据分析

数据分析是指用适当的统计分析方法对收集来的大量数据进行分析,将它们加以汇总和理解并消化,以求最大化地开发数据的功能,发挥数据的作用。数据分析是为了提取有用信息和形成结论而对数据加以详细研究和概括总结的过程 ---《百度百科》

以上是百度百科对数据分析定义,听起来比较抽象;数据分析是指把业务问题转化为数据问题,然后对数据处理分析形成分析结果,最终可以支持业务决策

这样讲还是比较难理解,我们通过一个例子具象化这个定义。

下图是订购明细,公司领导想了解以下公司哪个产品最受欢迎,哪个产品贡献最大,请给出分析结果。

结合上面对数据分析定义,我们需要明确几点:

  • 业务问题是什么:哪个产品最受欢迎?
  • 转为成数据问题是什么:产品销量

数据分析过程

第一步:明确目的

明确分析目的和确定分析思路, 是数据分析有效进行的先决条件,为后续过程提供清晰的指引方向。

第二步:收集数据数据

收集为数据分析提供素材和依据。

第三步:数据预处理

数据处理是对收集到的数据进行加工整理,形成适合数据分析的样式,是数据分析前必不可少的阶段。

第四步:分析数据

数据分析是指用适当的分析方法及工具,对数据进行分析,提取有价值的信息,形成有效结论的过程。

第五步:呈现数据数据

分析结果的呈现:

  • 表格:更准确地描述数据
  • 图形:更直观地表达观点

第六步:撰写报告

数据分析报告是对整个分析过程的一个总结,通过科学分析来评估企业运营质量,为决策者提供依据。

分析思路

在明确目标阶段时,需要梳理分析思路,分解分析目的,搭建分析框架;确定从哪几个角度进行分析,采用哪些分析指标?从宏观角度指导如何进行数据分析,复杂问题进行分解,将笼统的问题进行细化。

  • 从哪几个维度进行分析才完整而不会遗漏?
  • 分析时可以分为几个步骤?
  • 需要定义哪些 KPI 指标来表示?

五种典型的分析思路

数据分析方法

要了解数据分析,首先要了解数据分析的几种基本办法;掌握了它们,可以让你更了解你的用户(数据分析工程)诉求,同时可以更高效的沟通。

常用的数据分析三大类方法

数据分析与 OLAP 差异

关于什么是 OLAP,大家可以参考这篇文章OLAP联机分析:数据产品经理必备技能,这里就不再说明;OLAP 核心思想就是建立多维度的数据立方体,以维度(Dimension)和度量(Measure)为基本概念,辅以元数据,实现可以钻取、切片、切块、旋转等灵活、系统、直观的数据展现。

从上面对数据分析与 OLAP 理解,我们总结下数据分析与 OLAP 差异:

1、OLAP 分析更多的是指针对数据分析的一种解决方案 OLAP 分析首先是把数据预处理成数据立方。把有可能的汇总都预先算出来。然后在用户选择某种汇总时,OLAP 分析可以在预先的计算出来的结果基础上很快地计算出结果。从而可以很好地支持极大量数据的及时分析。

2、OLAP 是分析思路是从假设到验证 OLAP 是自上而下、不断深入的验证型分析工具,它常常以用户的假设为基础对数据查询与分析, 进而提取相关的信息。举个例子,数据分析师在为超市规划货品架柜摆设时,可能会先假设婴儿尿布与婴儿奶粉会常被一起购买,接着便可利用 OLAP 的工具去验证假设是否为真。

3、OLAP 是对现有数据的总结 OLAP 提供描述型的模型,告诉你什么样的产品在什么地区的销售额和去年的对比。

总结

回到我们分析数据分析与 OLAP 差异目的:选择适合业务场景的 OLAP 技术。从以上分析知道,OLAP 只是数据分析的一种解决方案:通过建立多维度的数据立方体,基于多个维度的交叉细分,能够让分析人员从多个角度、多个层面去观察和理解数据。此解决方案在提供各种便利同时,也有一些不足地方,最大问题是:业务灵活多变,必然导致业务模型随之经常发生变化,而业务维度和度量一旦发生变化,技术人员需要把整个 Cube(多维立方体)重新定义并重新生成,另外一点是业务人员只能在此 Cube(多维立方体)上进行多维分析,这种方式限制了业务人员快速改变问题分析的角度,从而使所谓的商业智能系统成为死板的日常报表系统。

哪我们 OLAP 技术选型,只是为了满足 OLAP 这个场景吗?其实很明显不是的,我们也没必要被 OLAP 这个概念限定死,应该更多结合业务场景与需求进行技术选型,毕竟技术只是业务实现的工具。所以我们在 OLAP 技术选型时不止是为了满足 OLAP 这个场景,更多是为了通过选型出来技术怎么更好的服务数据分析,如有些 OLAP 技术选型需要考虑是否支持跨库查询、是否支持与消息中间件对接从而实现实时数据分析等等。

  • 发表于:
  • 本文为 InfoQ 中文站特供稿件
  • 首发地址https://www.infoq.cn/article/6aa7efa2e384a5e42f20a6baa
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券