4个步骤3分钟,快速入门大数据分析

一、明确数据分析的目的   1、如果数据分析的目的是要对比页面改版前后的优劣,则衡量的指标应该从页面的点击率,跳出率等维度出发,电商类应用还要观察订单转化率,社交类应用要注重用户的访问时长、点赞转发互动等频次。   不少新人在设计自己产品的时候,可能会花费很多时间在产品本身的设计上,却没有花精力思考如何衡量产品的成功与否,在产品文档上写上一句类似“用户体验有所”提升的空话,这样既不利于产品设计顺利通过需求评审,也无法更有效的快速提高产品的KPI指标。   2、如果数据分析的目的是探究某一模块数据异常波动的原因,则分析的方法应该按照金字塔原理逐步拆解,版本->时间->人群。   比如发现首页猜你喜欢模块最近的点击率从40%下降到了35%,暴跌5%个点,这个时候先看看是不是哪个版本的数据发生了波动,是不是因为新版本上线埋点遗漏或有误造成的。   如果版本的波动数据保持一致,再看看数据是从什么时候开始变化的,是不是因为受到了圣诞、元旦假日因素的影响,页面上其他模块上线了新的活动影响了猜你喜欢的转化。  二、多渠道收集数据   收集方式一般有四类渠道。   1、从外部如易观或艾瑞的行业数据分析报告获取,需要带着审慎的态度去观察数据,提取有效准确的信息,剥离部分可能注水的数据,并需要时刻警惕那些被人处理过的二手数据。   2、从AppStore、客服意见反馈、微博等社区论坛去主动收集用户的反馈。我自己经常有空的时候就会去社区论坛看看用户的状态评论,一般这样的评论都是非常极端的,要么特别好,要么骂成狗,但这些评论对于自身产品设计的提升还是非常有益的,可以尝试去反推用户当时当刻为什么会产生如此的情绪。   3、自行参与问卷设计、用户访谈等调研,直面用户,收集一手数据,观察用户使用产品时所遇到的问题及感受。问卷需要提炼核心问题,减少问题,回收结果需剔除无效的敷衍的问卷。用户访谈需要注意不使用引导性的词汇或问题去带偏用户的自然感受。  三、有效剔除干扰数据   1、选取正确的样本数量,选取足够大的数量,剔除极端或偶然性数据的影响。08年奥运会上,姚明的三分投篮命中率为100%,科比的三分投篮命中率为32%,那么是不是说姚明的三分投篮命中率要比科比高?显示有问题,因为那届奥运会,姚明只投了一个三分球,科比投了53个。   2、制定相同的抽样规则,减少分析结论的偏差性。比如两条Push文案,第1条“您有一个外卖暖心红包未领取,最大的红包只留给最会吃的你,点击进入”,第2条“送你一个外卖低温福利,足不出户吃喝热腾美味,点击领取”。实验数据表明,第二条Push文案的点击率比第一条同比高了30%。那么真的是第二条文案更有吸引力嘛?结果发现是第二条Push文案的接收人群的活跃度明显高于第一条造成的。   3、剔除版本或节假日因素的干扰,新版本刚上线时的数据表现往往会很好,因为主动升级的用户一般是高活跃度的用户。临近周末或大型节假日的时候,用户的消费需求会被触发,电商类应用的订单转化率也会直线上升。因此,在数据对比的时候,实验组和对照组的数据在时间维度上要保持对应。   4、对历史数据遗忘。人与数据技术不同,数据技术有着100%的记忆能力,而人类根据艾浩宾斯遗忘定律1天后只能记起33%,6天后25%,31天后21%。因此,我们要合理的选择筛选时间段。比如猜你喜欢模块不仅要对兴趣标签的计分进行一定的加权处理,也要结合商品的生命周期等因素做一系列的回归实验,得出受众人群对各类兴趣和购买倾向的衰退曲线,利用有规律的时间变化有效删除老数据,去提升模块的点击率。 四、合理客观的审视数据  1、不要忽略沉默用户   产品经理在听到部分用户反馈的时候就做出决策,花费大量的时间开发相应的功能,往往结果,可能这些功能只是极少部分用户的迫切需求,而大部分用户并不在乎。甚至有可能与核心用户的诉求相违背,导致新版产品上线后数据猛跌。   忽略沉默用户,没有全盘的考虑产品大部分目标用户的核心需求,可能造成人力物力的浪费,更有甚者,会错失商业机会。  2、全面理解数据结果   如果实验结果的预期与我们的经验认知有明显的偏差,请不要盲目下结论质疑自己的直觉,而是尝试对数据进行更透彻的分析。   例如我曾经做过在首页给用户投放活动弹窗的实验,发现实验组的数据不管在首页的点击率,订单转化率乃至7日留存率方面都远超对照组,首页上的每一个模块的转化率都有明显的提升,远远超出了我们的预期,那这真的是活动弹窗刺激了用户的转化率嘛?   后来我们发现在首页能够展示出活动弹窗的用户,往往在使用环境时的网络状态比较好,在wifi环境下,而未展示弹窗的用户则可能是在公交/地铁/商场等移动场景下,网络通讯可能不佳,因此影响了A/B实验的结果。  3、不要过度依赖数据   过度依赖数据,一方面,会让我们做很多没有价值的数据分析;另一方面,也会限制产品经理本来应有的灵感和创意。   正像罗振宇在时间的朋友跨年演讲上提到的一样。用户要什么,你就给什么,甚至他们没说出来你就猜到了,这叫母爱算法,在内容分发领域没有人比今日头条做得更好,但母爱算法有很大的弊端,在推荐的时候会越推越窄。 五、总结   美国最成功的视频网站Netflix通过基于用户习惯的分析,将大数据分析深入到电影的创作环节中,塑造了风靡一时的美剧《纸牌屋》。然而Netflix的工作人员告诉我们,不应该迷恋大数据   如果说电视剧评分9分是精品的话,大数据可以让我们脱离低分6分以下的风险,却也会带我们按部就班的走向平庸的绝大多数7-8分之间。

原文发布于微信公众号 - BestSDK(bestsdk)

原文发表时间:2017-05-23

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏Java架构师进阶

技术变化那么快,程序员如何做到不被淘汰?

 中国有很多年轻人,他们18,9岁或21,2岁,通过自学也写了不少代码,他们有的代码写的很漂亮,一些技术细节相当出众,也很有钻研精神,但是他们被一些错误的认识和...

873
来自专栏张善友的专栏

Professional K2 blackpearl

所有您想了解的有关K2 blackpearl以及流程驱动应用程序知识尽在于此书 ? Wrox Press, 2009 (点击窗口右边网站链接即刻订购) K2...

2299
来自专栏服务端技术杂谈

从头条用Go编程语言说起

大家都知道头条主要的编程语言是Golang和Python,认识的一些朋友去到头条之后也是从其他语言转到了Golang了。

4732
来自专栏13blog.site

Spring+SpringMVC+MyBatis+easyUI整合优化篇(十四)谈谈写博客的原因和项目优化

阶段总结 又到了优化篇的收尾阶段了,这其实是一篇阶段总结性的文章,今天是4月29号,距离第一次发布博客已经两个月零5天,这两个多月的时间,完成了第一个项目ssm...

2924
来自专栏腾讯社交用户体验设计

空·境——腾讯微云为空页设计

1822
来自专栏葡萄城控件技术团队

如何对Internet Marketing网络市场营销进行数据报表分析

市场营销是为创造实现个人和组织的交易,而规划和实施创意、产品、服务构想、定价、促销和分销的过程。传统的营销模式是一种交易营销模式,会通过传统的营销渠道对外销售产...

1283
来自专栏BestSDK

不会这四项数据分析标准,何谈精细化运营?

一、明确数据分析的目的 1、如果数据分析的目的是要对比页面改版前后的优劣,则衡量的指标应该从页面的点击率,跳出率等维度出发,电商类应用还要观察订单转化率,社交类...

2174
来自专栏程序员互动联盟

什么样的人不适合学编程?

软件蚕食一切。未来属于程序员。所以人人都想当程序员。但是并不是每个人都能当好程序员。在你做出决定前还是先看看自己能不能当好程序员吧。可是什么样的人不适合当程序员...

2894
来自专栏java思维导图

一个架构师谈什么是架构,以及怎么成为架构师

作者:袁鸣凯 来源:https://blog.csdn.net/lifetragedy/article/details/43925857 今天,来点轻松的话题。...

3146
来自专栏JAVA高级架构

一个架构师谈什么是架构以及怎么成为一个架构师

架构的定义 先来看看软件架构的普遍定义吧。 一个程序和计算系统软件体系结构是指系统的一个或多个结构。结构中包括软件的构建,构建的外部可见属性以及它们之间的相互关...

3507

扫码关注云+社区

领取腾讯云代金券