以电商为例,说说数据分析的5个思维方法

数据分析真的很重要,能从一堆看似杂乱的数据里,找到问题并解决问题。从数据上的变化,来判断甄别效果得失;简直是居家旅行,运营生意的必备良品。

首先,我们要知道,什么叫数据分析。其实从数据到信息的这个过程,就是数据分析。数据本身并没有什么价值,有价值的是我们从数据中提取出来的信息。

然而,我们还要搞清楚数据分析的目的是什么?目的是解决我们现实中的某个问题或者满足现实中的某个需求。

那么,在这个从数据到信息的过程中,肯定是有一些固定的思路,或者称之为思维方式。

第一大思维——对照

“对照”俗称对比,单独看一个数据是不会有感觉的,必需跟另一个数据做对比才会有感觉。比如下面的图a和图b。

图a毫无感觉

图b经过跟昨天的成交量对比,就会发现,今天跟昨天实则差了一大截。

这是最基本的思路,也是最重要的思路。在现实中的应用非常广,比如选款测款丶监控店铺数据等,这些过程就是在做“对照”,分析人员拿到数据后,如果数据是独立的,无法进行对比的话,就无法判断,等于无法从数据中读取有用的信息。

第二大思维——拆分

分析这个词从字面上来理解,就是拆分和解析。因此可见,拆分在数据分析中的重要性。在派代上面也随处可见“拆分”一词,很多作者都会用这样的口吻:经过拆分后,我们就清晰了……。不过,我相信有很多朋友并没有弄清楚,拆分是怎么用的。

我们回到第一个思维“对比”上面来,当某个维度可以对比的时候,我们选择对比。再对比后发现问题需要找出原因的时候?或者根本就没有得对比。这个时候,“拆分”就闪亮登场了。大家看下面一个场景。

运营小美,经过对比店铺的数据,发现今天的销售额只有昨天的50%,这个时候,我们再怎么对比销售额这个维度,已经没有意义了。这时需要对销售额这个维度做分解,拆分指标。

销售额=成交用户数*客单价,成交用户数又等于访客数*转化率。详见图c。

图c是一个指标公式的拆解

图d是对流量的组成成分做的简单分解(还可以分很细很全)

拆分后的结果,相对于拆分前会清晰许多,便于分析,找细节。可见,拆分是分析人员必备的思维之一。

第三大思维——降维

是否有面对一大堆维度的数据却促手无策的经历?当数据维度太多的时候,我们不可能每个维度都拿来分析,有一些有关联的指标,是可以从中筛选出代表的维度即可。如下表

这么多的维度,其实不必每个都分析。我们知道成交用户数/访客数=转化率,当存在这种维度,是可以通过其他两个维度通过计算转化出来的时候,我们就可以“降维”。

成交用户数丶访客数和转化率,只要三选二即可。另外,成交用户数*客单价=销售额,这三个也可以三择二。

另外,我们一般只关心对我们有用的数据,当有某些维度的数据跟我们的分析无关时,我们就可以筛选掉,达到“降维”的目的。

第四大思维——增维

增维和降维是对应的,有降必有增。当我们当前的维度不能很好地解释我们的问题时,我们就需要对数据做一个运算,增加多一个指标。请看下图。

我们发现一个搜索指数和一个宝贝数,这两个指标一个代表需求,一个代表竞争,有很多人把搜索指数/宝贝数=倍数,用倍数来代表一个词的竞争度(仅供参考)。这种做法,就是在增维。增加的维度有一种叫法称之为“辅助列”。

“增维”和“降维”是必需对数据的意义有充分的了解后,为了方便我们进行分析,有目的的对数据进行转换运算。

第五大思维——假说

当我们拿不准未来的时候,或者说是迷茫的时候。我们可以应用“假说”,假说是统计学的专业名词吧,俗称假设。当我们不知道结果,或者有几种选择的时候,那么我们就召唤“假说”,我们先假设有了结果,然后运用逆向思维。

从结果到原因,要有怎么样的因,才能产生这种结果。这有点寻根的味道。那么,我们可以知道,现在满足了多少因,还需要多少因。如果是多选的情况下,我们就可以通过这种方法来找到最佳路径(决策)

当然,“假说”的威力不仅仅如此。“假说”可是一匹天马(行空),除了结果可以假设,过程也是可以被假设的。

我们回到数据分析的目的,我们就会知道只有明确了问题和需求,我们才能选择分析的方法。

原文发布于微信公众号 - CDA数据分析师(cdacdacda)

原文发表时间:2015-09-09

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏CDA数据分析师

3分钟轻松了解个性化推荐算法

摘要:如果去商场里买东西,我并不愿意听导购小姐讲的话,但是电商网站上的推荐,我还真的愿意看一看。【猜你喜欢】,好,那你就猜猜吧。 推荐这种体验除了电商网站,还有...

2515
来自专栏数据科学与人工智能

【数据】大数据用户画像方法与实践

首先看一下大数据与应用画像的关系,现在大数据是炙手可热,相信大家对大数据的四个V都非常了解,大数据应该说是 信息技术的自然延伸,意味着无所不在的数据。 ? 我...

8578
来自专栏新智元

机器学习论文呼吁“预注册”,事先评审专治“注水研究”!

所谓“预注册”研究,通俗点说就是,在实际着手开始研究之前,先将研究假设和实验设计方案等前期重要信息,向欲投稿的学术期刊进行事先注册,由期刊先行组织专家进行同行评...

883
来自专栏腾讯大数据的专栏

大数据产品-腾讯信鸽之手游流失预测

背景 随着游戏市场竞争的日趋激烈,越来越多的游戏运营服务选择借助大数据挖掘出更多更细的用户群来进行精细化,个性化运营,从而更好的抓住用户,获得更大的收益。在游戏...

3205
来自专栏机器之心

Nature | 耶鲁实现量子门的隐形传输,模块化量子计算的关键进展

这项新研究背后的关键原理是量子隐形传态,这是量子力学的独有特征,曾被用来在双方之间隐形传输未知的量子态,而不需要在物理上发送粒子本身。耶鲁大学的研究人员利用 2...

761
来自专栏人工智能快报

美国空军研究实验室携手IBM开发类脑感官超级计算机

据防务系统网站(DefenseSystem)报道,美国空军研究实验室(AFRL)与IBM将在人工智能领域展开合作,创新地设计一款由64芯片阵列驱动的大脑启发式超...

3485
来自专栏PPV课数据科学社区

以电商为例,数据分析的5个思维方法-简单粗暴

在博主雪言舟语看来,数据分析真的很重要,能从一堆看似杂乱的数据里,找到问题并解决问题。从数据上的变化,来判断甄别效果得失;简直是居家旅行,运营生意的必备良品。 ...

3458
来自专栏SDNLAB

2018年企业存储的7大趋势

今天的企业比以往任何时候都产生和存储海量的数据,且这样的趋势丝毫没有放缓的迹象。大数据、物联网和分析的崛起促进了数据指数级的增长,这一增长趋势正在推动组织扩大其...

3777
来自专栏人工智能头条

基于腾讯信鸽平台的手游流失用户预测模型概览

22110
来自专栏AI科技评论

盘点 | 聊天机器人的发展状况与分类

AI科技评论按:本文作者王海良,呤呤英语开发总监,北京JavaScript/Node.js开发者社区的运营者,曾就职IBM创新中心。本文为系列文章第一篇,由AI...

5788

扫码关注云+社区

领取腾讯云代金券