数据分析师不是“数羊”的!

咨询业内有一个经典的故事:

一个农民赶着羊群在草原上走,迎面碰到一个人对他说:“我可以告诉你,你的羊群有几只羊。”随即,他用卫星定位技术和网络技术将信息发到总部的数据库……片刻后,他告诉农民羊群共有1460只羊,并且要求农民给他一只羊作为报酬,农民答应了。随后,农民对他讲:“如果我能说出你是干嘛的,你能否把羊还给我?”那人说,“行”。农民说:“你是一个咨询顾问。”那人很惊讶,问农民是怎么知道的。农民说:“有三个理由足以让我知道: 1.我没有请你,你自己就找上门来; 2.你告诉了我一个早已知道的东西,还要向我收费; 3.一看就知道你不懂我们这一行,你抱的根本不是羊,而是一只牧羊犬。”

这个笑话在咨询界广为流传,并有不同的公司版本。有意思的是,许多资深咨询顾问看到这个笑话并不感到恼怒,而是会心地一笑。公开场合下,他们一定会非常自信地说,咨询非常深刻地影响企业的战略,因此具有非常重要的价值。不过私底下,他们对于是否真的“能改变世界”这一点并不够自信。

如今,数据分析、数据仓库、数据挖掘、大数据等概念热得发烫,数据分析师被认为是万众仰慕的职场新宠,关于数据分析师技能、职责、职业素质、发展前景等的讨论不绝于耳。就像“姚黑”一样,数据分析的质疑声也不断传出和放大,数据分析、挖掘到底能否产生价值,多大价值?

把数羊的故事改编一下:

一个农民有一群羊,农民找了一个年轻帮手,农民问道:“你看看这群羊怎么样?”,随即,年轻人走入羊群进行考察,并用各种统计方法和不同工具进行了全面的判断,然后,他告诉农民羊群共有1460只羊,仅有10只公羊、其余为母羊,可以繁殖的母羊有1000只,其余为羊仔,根据一些特征,羊群可以分为“肯吃型”、“疯跑型”、“活蹦乱跳小仔型”三类。农民听后既惊讶又失望,惊讶的是一个没放过羊的人和他一样了解羊群,失望的是他所听到的都是他早已知道的。

目前,数据分析员、数据分析师就有这样的境遇。他们是企业内部组建的“智囊”,被要求执行有关战略、解决业务问题等任务,被寄予厚望。不过,真正体会到价值的企业怕是不多,就像改编的故事一样,数据分析员、数据分析师们很快掌握了企业内部的“经验”,但为企业增值做出的贡献又能有多少呢?

富有经验的人才一直被企业所重视,但必须把“有经验”和“拍脑袋”区分开来看待,因为很多人把“拍脑袋”这顶绿帽子扣到了所有领导者头上,而从未估计这个人是否富有经验。数据分析被重视后,获得经验比以前更加快速和方便,一个熟悉数据分析、数据挖掘的毕业生,能够根据企业多年经营数据,快速入行,快速积累工作经验,然而,面对不期而遇的业务问题却多少有些茫然,此时,他们被打回原形,甚至不如一个身经百战的营业员。有头脑的领导者都知道:一线基层员工更加清楚这个业务问题为何会发生、应该如何解决!

或者你应该如此回答农民的问话:

“羊群共有1460只羊,仅有10只公羊、其余为母羊,可以繁殖的母羊有1000只,其余为羊仔。因此,当务之急是卖掉长肥的小羊,马上引进更多的种公羊,以解决当前种羊和母羊比例严重失调的问题;根据对市场的预估,5月份每卖掉一只小羊将比4月份多赚150元,因此,我们必须把握先机,4月前育肥,5月清栏;对于“疯跑型”羊,有必要采取两条腿绑绳的方法限制其大范围跑动,对于“活蹦乱跳小羊”应采取与成年羊隔离的放养的方式。”

读了前面的内容,现在我们重新认识一下什么是数据探索:

数据探索,就是在大量数据集中发现有用关系的系统性的方法,在开始之前,您不必知道寻找的是什么,您可以通过拟合不同模型和研究不同关系来探索数据,直到您发现有用的信息为止。

数据分析员、数据分析师不应当只会“数羊”!不应当只是发现本应该发现的“经验”!而应当掌握数据探索,发现潜在的价值,预见可能将发生的某种“坏的未来”!

中颢润对上面这段话给予了评价和补充,选摘如下:

数据分析不只是要预见某种“坏的未来”,同时也要预见某种“好的未来”,在规避风险的同时,也能抓住机遇,这才是数据分析的真正价值体现。

鉴于以上内容,可以从另外一个角度看数据分析师的层级(看图不解释):

本文分享自微信公众号 - PPV课数据科学社区(ppvke123)

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2014-01-20

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏CDA数据分析师

数据分析从哪里开始入门学习,可以推荐的书有哪些?

数据行业在迅速的发展,几乎每天都会出现新的技术和方法。因此,想要跟上这个行业的步伐是有挑战性的。之前CDA数据分析师曾列出了15位在科技和数据科学领域最具影响力...

44650
来自专栏ThoughtWorks

常用的几种大数据架构剖析 | 洞见

数据分析工作虽然隐藏在业务系统背后,但是具有非常重要的作用,数据分析的结果对决策、业务发展有着举足轻重的作用。随着大数据技术的发展,数据挖掘、数据探索等专有名词...

44560
来自专栏Python小屋

Python使用K-means聚类算法进行分类案例一则

K-means算法是经典的基于划分的聚类方法,是十大经典数据挖掘算法之一,其基本思想是:以空间中k个点为中心进行聚类,对最靠近它们的对象归类。通过迭代的方法,逐...

32660
来自专栏数据科学学习手札

(数据科学学习手札08)系统聚类法的Python源码实现(与Python,R自带方法进行比较)

聚类分析是数据挖掘方法中应用非常广泛的一项,而聚类分析根据其大体方法的不同又分为系统聚类和快速聚类,其中系统聚类的优点是可以很直观的得到聚类数不同时具体类中包括...

30150
来自专栏专知

CMU邢波教授:基于双向语言模型的生物医学命名实体识别,无标签数据提升NER效果

【导读】生物医学文本挖掘领域近年来受到越来越多的关注,这得益于,科学文章,报告,医疗记录的电子化,使医疗数据更容易得到。这些生物医学数据包含许多生物和医学实体,...

65470
来自专栏小小挖掘机

数据城堡参赛代码实战篇(三)---我们来探究一个深奥的问题!

每天12点是小编最激动的时候,因为自己写的帖子又可以与大家见面啦,昨天把帖子传到某个大神组织的数据挖掘交流群时,某挖掘机朋友问了小编一个深刻的问题,题目看似很简...

38450
来自专栏机器人网

一图向菜鸟解释机器学习、数据挖掘

随着数据科学在人工智能发展中大放异彩,数据挖掘、机器学习进入了越来越多人的视野。而对于很多人来说,诸如机器学习之类的名次听起来是神乎其技,但其真正的内涵却不为一...

30970
来自专栏程序源代码

大白话Scrapy爬虫

这两年爬虫技术应用比较火,最近在学习Scrapy,学习中写了一些笔记,分享给大家。写的不好多多包涵。 一、Scrapy蜘蛛框架 Scrapy是一个...

41770
来自专栏专知

【观点】漫谈推荐系统及数据库技术(二)——分布式数据库技术

【导读】推荐系统和数据库技术,一个是偏机器学习数据挖掘相关的应用,一个是偏系统存储相关的技术,这两者在实际中有很大的应用。上一次专知推出漫谈推荐系统及数据库技术...

41290
来自专栏专知

干货:必读机器学习书籍一览表

【导读】转眼之间春节假期已所剩无几,大家是否也开始制定新一年的学习计划?本文就为大家推荐一个机器学习书单,其中大多数可以免费观看,并附上pdf链接。书单内容包括...

368110

扫码关注云+社区

领取腾讯云代金券

年度创作总结 领取年终奖励