首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

做数据挖掘者不做数据收集者

【蛋社杂谈】做数据挖掘者不做数据收集者

文/爱吃橘子的水煮蛋

首先声明,写这个标题并没有对那些奋斗在制表一线的朋友们有任何不敬之意,毕竟谁都知道,庞大的数据才是数据分析的基础,没有数据收集者的努力,就没有数据分析师华丽的报表。小编想说的是,无论你是数据收集者也好,数据分析师也好,都要有一个持续改进的目标,——在数据中挖掘出更多的有价值的信息。

1

什么是有价值的信息

有价值的信息是指对报表的受众也就是报表的接受者而言有价值的信息。

例如报表的受众是一家服装公司的老板,那么他关注的信息肯定不仅仅是收入是多少、成本是多少、利润是多少、税交了多少这些简单的信息,他更希望能得到顾客的喜好、产品的销售走向、各项成本对销售业绩的影响、设计成本是偏重于请设计师还是外包给设计师、管理成本与生产成本的合适比例、企业的盈亏平衡点等内容,对于服装公司老板而言,这就是有价值的信息。

例如对小编这样的公众号而言,更关注的是那类文章的访问率更多、转发率更高、收藏率更高,哪个时段阅读量最大,哪种渠道推广的效果更好等内容,这些就是对小编有价值的信息。

每家企事业单位面临的环境都不同,报表受众对有价值的信息判断标注也不尽相同,这就需要报表的编辑者有更敏锐的判断力,如果没有也没有关系,简单的测试法即可,不停的挖掘数据能展示的信息,慢慢就能测试出报表受众的最标准,而且这样做也有个好处,对于某些不太清楚自己需要何种信息的报表受众而言,做客观选择题比做主观问答题更容易。

2

表哥、表姐与报表受众的矛盾

表哥、表姐是对战斗在制表一线的广大表奴们的一种戏称,作为主要战斗工具是报表的表格表姐们,共性是填表熟练、操作技能熟练、能短时间内完成大量报表的填写,这是好的方面,另外一个方面是因为常年与数据打交道,看问题的角度无法脱离于数字,容易拘泥于数字,用一句俗语来说,就是旁观者清当局者迷。

产生这个问题的原因是多样性的,但主要原因是制表者过于沉浸于本质工作中,受限于工作岗位与工作经历,缺乏对全盘的认知。一个好的数据挖掘者必然是某个行业的精英或翘楚,某个行业的精英或翘楚却未必是一个数据挖掘者,甚至连数据搜集都未曾从事过。这就造成某种管理者与制表者之间的代沟,前者认为后者提供的信息并不准确、质量偏低,后者认为前者提的要求天方夜谭、偏离实际。

这种代沟并不是某一方的错误,也可以说双方都有错误,错误的原因是双方都站在自己的一亩三分地考虑问题,没有从全局来看待问题,也凸显出一个更大的问题,看似在报表质量上的冲突,本质上反映出来的不仅是数据处理技术差异,更是数据处理认知差异。看似对数据信息无比关注的双方,其实都缺乏对数据挖掘的了解,也缺乏对数据挖掘的基本敬意,没有对数据的敬畏之心。

3

简单的分析并不是挖掘,也可能是犯错

大数据时代,数据的来源更丰富,报表分析工具也更多样化,数据分析似乎也成为是个人就可以做的工作了,然而真是这样吗?

以老师常用的平均分与总分衡量学生的成绩为例,在平均分相同的情况下,如果单看最高分,张三似乎是比李四更好的学生。加入标准差与离散系数后,可以看出李四虽然最高分不如张三,但他的稳定性比张三更好,分数的总体分布更接近70分这个分段。当然,用一次考试成绩来分析,在统计学上而言,存在样本过小的问题,如果能将多期成绩纳入对比,更能说明问题。

上例的平均分虽然是学校的例子,但我相信读者都能从中联系到些什么,对,你没想错,就是平均工资。虽然很多企事业单位每年甚至每月都会做关于工资的报表,更会基于平均工资做增降幅对比。但这样的数据分析由小编上面的例子就可以看出,问题很多,这些简单的分析非但不能向报表受众传达正确信息,更可能误导管理者做出错误决策。

下面的分析就是我们常见的工资分析了,从表中我们可以得出的信息时这样的,四月的工资成本比三月的工资成本提高了5.5个百分点,其中工资涨幅最高的是李四,其次是张三,涨幅最小的朱六。这样的报表提交上去以后,会给管理者造成什么样的感觉?会促使他做出什么样的决策呢。

我们给报表加入标准差,分析表的内容发生了变化,这次变成排在首位的是朱六,事实上从绝对值的角度来讲,确实朱六增加的工资最多,但若从增幅而言也确实是李四最高。

若从增加工资的比重来分析,从大到小排序的顺序也是朱六、李四、张三。

作为一个合格的表哥表姐,并不是仅仅按照上司的要求或前任的惯例提交了报表就万事大吉了,能否从数据中挖掘更多的信息传递给报表阅读者才是关键,片面的数据分析非但不能正确反映数据的真实信息,反而会提交错误的信息给报表阅读者,间接诱使管理者做出错误决策。

4

如何摆脱局限性,成为数据挖掘者

坦白而言,小编也不是一个合格的数据挖掘者,只是万里长征才踏出第一步,因而小编能给出的建议是:

一、尽可能了解所在组织运作的细节

大部分的制表者工作范畴都局限于办公室两米见方的范围内,很少有机会走出去,也可能是懒得走出去,缺乏与业务运作部门的直接沟通,对组织运作细节了解甚少。但是想要在数据中挖掘更多有价值的信息,制表者必须多与业务运作部门尤其是一线操作人员沟通交流,尽可能了解组织运作的每一处细节,这样才能有针对性的在数据中提取有用信息。

二、保持一种永远在学习的心态

信息时代,知识的迭代是非常快的,不需要五年,你所学到的知识就大部分被淘汰了。如何跟上时代的步伐,如何熟练应用各种分析工具,如何展现当下大众和管理者最关心的信息都是表哥表姐们必须要面对的问题,大浪淘沙、不进则退,职场内容不下古董。

三、大局观和展示手段比技巧更重要

技巧是你做出漂亮报表的基础,但漂亮报表并不是制表者的终极目的,想要报表阅读者快速提取你想传达的信息,你需要一些特殊的手段。

A 能用图就别用表

人是视觉动物,大脑优先处理的是图片信息,而不是文字或数字信息。

下面是将张三的成绩分别用表与图展示出来,对比可以看出,用图能更直观的展示张三的偏科程度。

B 如果表的明细很多,一定要提取重要信息在前面,例如提交给销售经理的表格,可以将销售经理最关注的最佳销售单位放在前面,让他在打开表格的第一时间就快速读取到最关注最有价值的信息。如果他对其他信息感兴趣,有时间的话,他会查看,但对于制表者而言,能让阅读者在最短时间内读取到最有价值的信息才是终极目标。

C 要善于利用第三方工具

表格的优点是数据详实,缺点是体积大、展示手段缺乏,要破解这个困境,只能借助于其他工具,例如PPT、思维导图、PDF、word、PS、长图文生成工具等。但不管利用哪种工具,都需要注意的是,文件不能太大,不能使用阅读者可能打不开的文件格式。

—— END ——

  • 发表于:
  • 原文链接http://kuaibao.qq.com/s/20180501G0M87D00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券