前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >吐血整理!一文看懂数据分析报告中的图表

吐血整理!一文看懂数据分析报告中的图表

作者头像
陈学谦
发布2020-05-25 15:34:47
2.7K0
发布2020-05-25 15:34:47
举报
文章被收录于专栏:学谦数据运营学谦数据运营

几乎所有的数据分析师的招聘JD中都要求具备可视化和使用PPT制作分析报告的技能。哪怕不是数据分析师的岗位,例如产品、市场、运营等,哪怕是学校里的教师,每天也会接触大量的图表。

图表的恰当使用与正确理解,很多时候能够提升沟通效率、发现问题的速度和运营效率,所以呢,今天就来详细说一说图表。

1.图表中的6种基本元素

图表中的元素一般包括以下6项:

①图表标题:用于介绍图表的主题。清晰而准确的标题能够让读者第一时间清楚明了图表所要表达的意义。

关于动态标题在PowerBI中的实现,可以参考以下文章:

Power BI从动态标题到多行标题,这里的车速足够快,抓紧来看!

②横轴纵轴标题;

③类别名称;

④图例:用符号和颜色来区分图形里的不同类别;

⑤网格线,一般用于不显示准确的数据标签时,看看某个数据大致在哪个区间内,如果使用数据标签,一般会删掉网格线;

⑥数据来源:提升数据可信度。

一般而言,为了图表的简洁精炼,这6个元素不必所有都用。

下面图片中的图表数据来源:艾瑞咨询出品的《2019年中国网络招聘行业市场发展半年报告(2019H1)》,数据周期:2019年1月-2019年6月。

2.表格、矩阵

很多人其实不把表格当做可视化对象,可视化又叫做图表,就是图+表。实际上,表格是应用最广泛的可视化对象,而且是在绝大多数情况下最为有效的可视化对象。

从表格中我们可以看出,2019年,金融行业和娱乐媒体的独角兽占了行业估值的前两位。

虽电子商务虽然独角兽数量遥遥领先,但是最近几年抖音、快手等平台横空出世,撬动了大量的资金涌入,估值增长十分迅猛。

所以我们可以得出的数据结论是,当前毕业生想要找工作或者已工作人士想要进入一个新的行业,金融行业和娱乐媒体是最佳选择。

当然说到这,不得不提一嘴,第一财经的表格,翻了翻这个公众号的表格,大都是这个样子的:

咱对读者至少有个基本的礼貌吧:

财大气粗,有钱任性啊。

3. 4种常见的图形

图表中的图有非常多的种类,纷繁复杂。最常用的有4个:散点图、折线图、柱状图、条形图。有不少图形都是从这4种基本类型演变而来的。在各种数据分析报告中,我们经常会看到这4种常见的图形。

1)散点图

比如,我们想知道各个分公司的业绩完成情况与使用PowerBI报告的频度之间的关系:

我们可以把每个分公司的报表本月查看次数和本月的业绩完成率做成散点图,大致可以显示出数据之间的相关性。然后再添加一条趋势线,是不是更能看出来它们之间有明显的相关性:

散点图可以比较直观地展示两个指标互相之间有没有关系。尤其是数据量很大时,散点图会有更精准的结果,尤其是配合趋势线分析。在回归分析中我们经常会用到散点图。

2)折线图

对于时间序列的数据,我们一般采用折线图来可视化,按照从左到右日期逐渐增长的方式进行展示。

根据mUserTracker监测的数据显示,各招聘平台的月总有效时长差距较为明显,但TOP2招聘平台的整体变化趋势一致,都在3月达到最大值。同时, TOP1平台前程无忧的月有效使用时间在3月与其他平台差距最大。整体来看,各招聘平台的用户规模相对稳定。BOSS直聘在2月与猎聘拉开接近一倍的差距,稳居TOP3。这背后的原因也是平台在春招前夕的品牌宣传活动助力用户行为的发生。

3)柱状图

柱状图一般和折线图一起配合使用,一个来表示总量,一个表示增长率或者完成率等信息。

有些时候,也用来对比分析各个类别在同一组内的情况:

除了竖着的柱状图,还有水平的柱状图:

如果类别在水平方向摆放显得拥挤的话,那么纵向的摆放就会更清晰一些。

当然,柱形图还有许多丰富的应用。

堆积柱状图

堆积柱状图的好处是不仅能比较各类别总体区别,还能同时看出每个类别中子成分的占比情况,可以分别对子成分进行对比。但这种图形肉眼其实很难分辨出来,比如下面这张图,中间的几个柱子,你就是再怎么仔细看也看不出谁大谁小来。

瀑布图

可用于描述整个过程中发生了什么事情,很适合讲故事,能够将想表达的重点给抽离出来。

以下这个例子中的瀑布图,展示了过去一年中公司员工总数的变化情况。

拱形桥的图案很漂亮,在设计上也是很有考究的。哪怕最后的人数少于最开始的人数,在视觉上也会显得是增长了。如果你先排列转出和离职,再排列招聘和转入,会出现凹型图,就不是很美观了。

直方图

对于大量的杂乱数据,很多时候我们不想直接用某个量作为轴,而是想把这个量切割为一定大小的范围,再进行统计,这就是直方图。

下图表示的是某个班级的学生体重分布的直方图,是按照5KG为一个范围进行统计的:

在PowerBI中我们可以通过添加一列体重范围来实现,不过这有个小缺点,如果想以10kg为变化范围来查看时,只能修改数据源了,那么有没有办法实现参数的方式,任意选择一个区间大小来划分呢?

答案是肯定的,后续会专门写一篇文章说明这个问题。

4)条形图

条形图与水平柱状图很相似,只不过条形图一般并不是一个独立的可视化对象,而是放在矩阵或表中:

从而让表——这个最基础的可视化对象更加生动与直观:

这样,表和矩阵就不再是孤零零的数字排列,而是有了和柱状图效果一样的可视化图形排列,实现了真正的图表合一,极大地增强了表的应用场景。

前文讲过,很多其他图形都是基于以上4种基本图形演变而来,接下来我们再介绍几种图形。

4.其他图形

饼图或环形图

饼图或环形图是用面积或环长度表示一组数据中各类的占比。下图是我账号(学谦数据运营)中对不同渠道阅读文章占比的环形图。

比如我的账号中聊天会话和公号会话是占比最高的,75%左右,还算比较清晰:

但是,需要注意的是,我们要尽量避免使用饼图,为什么呢?

因为人的眼睛其实很不擅长在二维空间进行定量的测量与比较,很多时候容易被欺骗。最常见的一个例子,是我们在初二年级第一次学习物理时的第一章第一节的第一张图:

尤其是当饼图的各部分大小很相近时,你很难判断出哪一块的面积更大。比如20%和25%在饼图上如果不标注数字大小,仅凭肉眼是很难分辨出区别的。

更不要说,现在很多可视化对象设计的都很”高级“,在下图的”三维饼图“中,26%的占比在视觉上要大于33%的部分,很容易给人错误的理解。

因此,饼图应该避免使用。

箱线图

箱线图用来展示数据集的描述统计信息,也就是四分位数。线的上下两端表示某组数据的最大值和最小值。箱子的上下两端表示这组数据中排在前25%位置和75%位置的数值。箱中间的横线表示中位数。

下图的箱线图是对不同工作经验的薪酬比较。横轴是工作年限,纵轴是薪酬。通过比较数据,我们可以看出随着年份上升,薪资待遇的上升也是非常明显的,尤其是3-5年这一段,提升的跨度非常之大。另外,从现有数据来看,数据分析师似乎是个常青的职业方向,在10年内大概不会因为年龄的增长导致收入下降。

再比如你是一位互联网电商分析师,你想知道某商品每天的卖出情况:该商品被用户最多购买了几个,大部分用户购买了几个,用户最少购买了几个。箱线图就能很清晰的表示出上面的几个指标以及变化。

热力图

热力图是用高亮形式展现数据。下图是智联招聘APP和拉勾APP用户在北京的工作地点。从图中高亮红色的区域,我们可以看出智联招聘APP用户北京工作地在全市范围内均有分布,而拉勾APP用户在北京工作地更多的集中在中关村、上地、望京、国贸等互联网企业密集区域。

互联网产品中,热力图可以用于网站/APP的用户行为分析,将用户浏览、点击、访问页面最多的位置以高亮的可视化形式表现。从而根据用户行为改善网页、APP的设计。

雷达图

雷达图在商务、财务领域应用较大,适合用在固定的框架内表达某种已知的结果。因为这个图形像雷达(图)的放射波,而且具有指引经营“航向”的作用,所以叫做雷达图。

下图是三个招聘类APP用户中,猎聘同道APP用户更加偏好个户美容、汽车、健康、家具等类型应用,对于个人生活品质要求更高。拉勾APP用户对于母婴类应用兴趣要远低于其他两个APP用户。比起孩子,拉勾APP用户更关注房产,租房、买房是他们的重心所在。

词云图

词云图是对数据集中出现频率较高的“关键词”给予视觉上的突出,从而过滤掉大量的文本信息,使用户只要一眼扫过文本就可以看到出现频率较高的关键词。

下图是从招聘网站爬取的对数据分析师岗位的技能要求关键词,用这些关键词我们可以做出词云图。通过词云图,我们发现公司需求频率最高的技能是表格神器Excel和查询语言SQL,虽然这几年Python非常非常火,各种BI软件也都喧嚣尘上,但是基本技能还是Excel和SQL。而PowerBI依旧名不见经传,尴尬……

漏斗图

漏斗图经常用来做用户转化率的可视化,其中最著名的就是硅谷用户增长专家肖恩·埃利斯在他的书《增长黑客—如何低成本实现爆发式成长》中提出的AARRR漏斗模型。

这个模型对应的分别是5个过程:Acquisition(获取用户),Activation(激活用户),Retention(提高留存),Revenue(增加收入),Referral(病毒传播)。

这套体系模型也不仅适用于互联网行业,它也可以应用到面向大众消费者的各个行业中,帮助业务成长,实现经济增长。下面我们分别看下这个漏斗图中的每个部分。

1)Acquisition(获取用户)

这个环节用一句话来概括就是:用户如何找到我们?

在互联网行业中,很多创业公司死掉并不是因为他们的业务或产品不行,而是因为他们的获客成本很高,并且没有办法降下来。肖恩最初在硅谷的云存储业务的创业公司Dropbox工作。这家公司开始时每获得一名用户的成本高达400美元,而它提供的付费服务每年是99美元。

肖恩对低成本获客,提供了两个建议:一是语言——市场匹配,就是你怎么说才能打动用户的心;二是渠道——产品匹配,就是在哪儿亮相才能吸引用户的目光。

语言——市场匹配,实际上考验的是抓住用户注意力的能力。现在人们关注一条网络信息的时间通常是8秒,如果不能在8秒内告诉用户你的产品对他有什么用,你就失去了一次获客的机会。

2001年iPod问世时,乔布斯完全可以在他传达的内容中解释为何他的播放器与众不同,性能更加优越,但他没有这样做。他明智地决定不使用任何形容MP3播放器功能的表述。他只用了一个简单而迷人的句子——“将1000首歌放在你的口袋里”,就彻底重塑了人们对便携式播放器魅力的认知。

而渠道——产品匹配是说产品投放在什么渠道才能直达用户的视线范围。如果你是一款为企业服务的软件,在娱乐网站打广告就非常不合适。

渠道可以分为三类,一种是口碑渠道,适合病毒营销;一种是有机渠道,适合搜索引擎优化、内容营销;还有一种是付费渠道,比如电视广告、赞助等。

实时分析新用户的数据量和明细,请参考:

【运营】新用户数量?Power BI简单三步计算

【运营】新用户明细?Power BI一招帮你搞定

2)Activation(激活用户)

这个环节用一句话来概括,就是用户的首次体验如何?

很多手机应用,注册用户不少,但是打开率不高。你要做的是激活他们,让他们真正地使用产品。

想唤醒休眠用户,就得先摸清楚产品的“啊哈时刻”(Ahamoment)。什么叫“啊哈时刻”呢?

说白了就是让用户感受到产品亮点情不自禁地发出赞叹的时刻,它对应的就是打动用户的产品亮点。比如网易云音乐,在众多音乐软件中突围的亮点就是评论,用户打开软件,可能第一件事不是听歌,而是看评论,心里面会有一些赞叹。

要想激活用户,得绘制一幅通往“啊哈时刻”的路线图。比如你负责的产品是个购物软件,在新用户体验到啊哈时刻之前,必须要完成下面这些步骤:下载app,找到所需商品,放入购物车,创建账户,输入姓名,加入信用卡和配送信息,然后点击购买。在这一系列动作中,到底用户停留在了哪一步?是搜不到要的东西,还是创建账户太麻烦,或者是页面设置不合理?你要计算每个节点用户的损失率,来相应地提高产品性能,改善用户体验。

接下来,你可以通过游戏化的做法,给用户奖励,比如打卡、积分。你还可以通过触发物,唤醒用户,比如推送信息等。这些都需要反复的试验,才能找到最有效的激活方法。这方面得到app就做的不错,可以作为案例研究。

3)Retention(提高留存)

第三个环节是留存。也就是用户会回来吗?

在前面第2个环节用户终于被唤醒了,这时候你的任务就变成了如何让用户变成回头客。留存的核心目标是让用户养成使用习惯。

在这个阶段,你要明白习惯是如何形成的。这里有一个经典的案例,就是亚马逊的会员服务。在刚推出时,许多分析人士都说这个计划必定会失败,因为美国的配送成本是很高的,而99美元的会员服务给会员免费配送一年,亚马逊肯定会亏。但亚马逊的真正目标是改变人们的习惯,让他们在购物中习惯会员优惠价格,习惯免运费,从而不再去其他家买东西。

留存用户根据初期、中期和长期阶段有不同的做法,增长黑客可以通过分组来观察,并持续提供实际回报来留住用户。

有段时间Facebook发现自己用户流失得很厉害,之前注销账号的确认页面有一段提示:你是不是要注销啊,你确认下,你再多确认一下,OK你去意已决那就给你注销。

后来Facebook改变了下确认页面,在注销结束之前增加了一个页面。这个页面它会把跟你互动比较亲密的五个朋友头像列出来,然后配上文字说:你确定你要注销嘛?你如果要注销的话,这些人再也看不到你了,你也再也关注不了这些朋友的新的情况了,你是不是要再考虑一下?

就是这个东西增加了3%的留存可能,相当于Facebook一年有三百万个流失就这样被避免掉了。

因此,获取沉睡与流失的客户明细用来定向激活就显得格外重要:

【运营】沉睡、流失客户分析?Power BI一招帮你搞定

4)Revenue(增加收入)

也就是如何赚到更多钱?

完成了上面所有的步骤,终于来到最有挑战性的一关,那就是如何从用户身上获得真正的收益。比如让用户续订、创造更多的广告位等等。

虽然商业模式不同,变现的方式不同,但是有一个概念需要重视,那就是夹点(pinchpoint),它指的是损失潜在收益的地方。对于电商企业来说,用户从挑选商品到完成购买之间是一个危险区,很多人中途会放弃购买。增长团队要评估这些常见夹点,分析用户在这些点放弃的原因。

续订或者复购需要从不同的时间维度进行分析,有些行业是按季度进行的,有些呢是按照月进行,那么我们就需要针对不同维度进行分析,下文是任意维度的复购率计算:

【运营】任意两个时间段的复购率?Power BI一招帮你搞定

5)Referral(病毒传播/裂变)

用一句话来概括就是:用户会告诉他人吗?

所以我们经常在各种平台或软件的界面看到如下的单一调查问卷:

不要小看这个调查问卷,它是通过这个简单的问卷,提醒你,你是”可以“向朋友推荐的,它在无形当中影响你的行为。

之前有一段时间,微信公众号或者很多课程都是通过朋友圈转发图片裂变的方式进行广泛地传播,实现了非常好的效果。

在部分行业也称之为”转介绍“,企业往往会对转介绍和被转介绍的双方都给予一定的优惠来迅速传播。

OK!

本节我们已经学会了常见的图表。

下次我们再聊聊,面对不同的业务场景,如何用选择并用Excel或PowerBI绘制出有效的图表。

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2020-05-20,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 PowerBI生命管理大师学谦 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
腾讯云 BI
腾讯云 BI(Business Intelligence,BI)提供从数据源接入、数据建模到数据可视化分析全流程的BI能力,帮助经营者快速获取决策数据依据。系统采用敏捷自助式设计,使用者仅需通过简单拖拽即可完成原本复杂的报表开发过程,并支持报表的分享、推送等企业协作场景。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档