首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

什么是数据分析

什么是数据分析?

一句话定义,数据分析是一个从数据中通过分析手段发现业务价值的过程。这个过程的起点是获取一份数据,这个过程的终点是发现业务价值。过程可以大致为分数据获取——数据清洗——数据处理——数据建模——分析结果呈现——业务价值发现——业务价值实现这几个阶段。

在具体说明每个阶段之前,首先要谈下我对数据和业务价值这两个概念的理解。

数据:我认为数据不是简单的数字,换句话说,如果你只告诉我一串数字 170、172、180而没有其他信息,那么这几个数字就仅仅是数字而已,而不是数据。数据除了数字本身之外,还必须包含数字的来源、度量方式、单位、代表的业务场景(即数据产生的上下文环境)等等。其中,我认为场景是最重要的。仍旧拿上面的例子来说,如果你告诉这是三个地区的平均身高,那可以说这是一组有意义的数据了,至于单位,我会猜到是厘米;而来源和度量方式决定了这个数据的可信程度。

业务价值:不能服务于业务的数据分析是没有生命力的,不能产生业务价值的数据分析是徒劳无功的。因此,能否实现业务价值决定了这是否是一次成功的数据分析。而分析工作只是实现了这个过程的第一步,它通过分析师的视角将价值呈现于业务人员面前,分析的结果只有被业务人员理解,并最终通过业务人员的努力转化为业务实施(在大多数公司数据分析和业务运营这两种不同的角色会分属不同的部门,增长黑客则是一种新的形式),才可能最终实现价值。

过程的详细说明:

数据获取:这个阶段的输入需要一个分析目标,哪怕不是那么的明确和清晰。为什么需要一个目标?在一个大型企业中,可以获取的数据往往是海量,如果没有一个目标限制,那数据分析往往是无从着手的。这个阶段的输出是一个数据子集,它可以是物理上的货逻辑上的。所谓物理上的,就是把分析中用到的数据单独拷贝到一个地方;而逻辑上就只是定义出可用的数据范围,比如时间周期、维度、指标等。这个阶段的困难之处在于理解相关的数据源,因为数据源文档不完整或者变更的情况经常在业务中发生。

数据清洗:通常包括异常数据的处理、缺失数据的处理、数据的一致性变换、编码的替换等

数据处理:对数据进行汇总,或者形式上的变换,以便可以适用于后期的建模

数据建模:用统计分析或机器学习算法对数据建模,以便描述数据或对未来进行预测。其实大多数分析师在这个阶段只观测数据的同比、环比的趋势上的变化,亦或对指标在不同维度上进行拆分,以观察维度对指标变化的影响。以上三个阶段在很多书籍中都有具体的技术描述,不再赘述。

分析结果呈现:通常认为,这个阶段的主要任务是把建模的结果以图、表或者更加复杂的可视化方式呈现出来。但我认为不止于此。首先,呈现结果不是这个阶段的目的,目的应该是让业务人员对分析结果有充分的理解。其次,呈现的手段除了可视化,最重要的应该是沟通。而沟通是双向的,可以保证结果最大程度上被他人理解。

业务价值发现:通常数据分析师会在分析结果中提出对业务的价值,但是这个价值只有被业务人员认可才有可能实现。所以,此处的“发现”应该是分析师和业务人员的“共同认知”。

业务价值实现:业务价值发现和实现经常不被包含在数据分析过程中。但是,就如同我对数据分析的定义,业务价值才是数据分析的终极目的。因此,我认为价值的实现才是整个过程的最后一个阶段,这个阶段虽然是有业务人员控制的,但是仍然需要分析师的深度参与。因为双方对于分析结果的理解和价值的发现经常出现偏差,需要在实践中逐步达到统一。

最后,关于数据分析过程,我认为有几点需要给予非常的重视:

在开始做分析之前,首先要有分析目标!分析目标!分析目标!重要的事情说三遍。

过程不是单向的,在后一个阶段中发现问题时可以跳回到前一阶段

过程不是一次性,而是不断循环往复的。上一次分析过程的终点,可能是下一次分析过程的起点。我们经常会在业务价值发现和实现阶段发现新的分析主题,并把它作为下一次分析的起点。

对于任何一次分析来讲,不是每个阶段都是必需的

整个过程中的大多数时间都需要分析师和业务人员的密切合作

  • 发表于:
  • 原文链接http://kuaibao.qq.com/s/20180319G1FQJ100?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券