荐读|找不到完美数据科学家?你还可以组建一支数据科学梦之队

导读

提供洞察和分析的公司都在尽力为自己组建完美的数据科学团队,这通常有两条路可以走。

大部分公司都在挣扎中选择了第一条路:寻找这些工资非常贵又很少见的独角兽人才,即同时具备这多种技能的独立个体。

完美的数据科学家完美地掌握了数学、统计学、编程以及沟通技术。这些人不光具备完成复杂工作的专业技术能力,还能够向非技术人员解释这些技术工作可能会带来的影响。

除了这些数据科学家会很昂贵的事实之外,这些天才科学家一周7天,每天24小时连轴工作也是不太可能的。

当然这不是唯一的一条路。

人类史上最早的科学家之一亚里士多德曾经说过:“整体大于它的各部分之和”,这给了我们一些启发。与其寻找这些很受欢迎的同时具备三方面技能的人,还不如挑选分别具备其中一项技能的人来组成一个团队。毕竟,没有一个人能够永远解决组织不断增长的对数据科学研究的需求。它需要一个数学家来负责深入钻研,还需要一个具备交叉学科知识的人来进行横向整合,最终组成一个完美的团队。

数据科学团队的活力

任何一个数据科学团队的终极目标就是要成为一个解决问题的机器,一个能在不断变化的环境中不断搅动出价值的团队。越来越丰富的数据给曾经无法回答的业务问题提供了可能,这就给客户对洞察复杂性的期待提升到了一个新的高度。但随着这一套连锁反应而来的却是没有成熟方法论和解决方案的问题。随着输入越来越多样化,所需要的匹配的技能同样需要变得多样化。“酷呆瓜”团队的三个特点没有一个是可以缺失的,因此这个团队的集体智慧才真正是当今数据世界的驱动力。

显然,完美数据科学家团队中的任意两块都无法独立于第三块运作。而且,挖掘并保持数据科学家团队的内部平衡才能带来最大程度的准确性和相关性。

数学家/统计学家

这些受过训练的学者在理解了相关理论以及结果所需要的条件后,基于这些输入构建起先进的模型。

程序员

这位亲自操刀的架构师负责清洗、管理以及修整数据,以及建造模拟器或其他高科技工具来使数据变得更加方便易用。

沟通者/内容专家

将技术翻译为业务的专家利用自己的全局观,基于过去的知识帮助寻找技术与用户需求的连接点。

这些技能的互相支持才使得团队变得完整,并具备完美的数据交付能力:

数学家/统计学家的工作严重依赖于程序员。“垃圾进入垃圾出去”的概念在这里非常适用,也就是说如果程序员没有清晰地获取数据、管理数据,那么科学家很难构建出有用的模型。此外,数学家和程序员又依赖于沟通者的知识。即便数据是完美的,也符合统计学结论,如果其无法直接涉及到要解决的商业问题,那么这些就是没有意义的。此外,内部不平衡的团队将会面临一些无法充实准备的困难,也无法交付出完美的作品。

是购买还是自建?

今天的世界充满了大量、高速的数据,企业都面临着一个选择。传统那些写代码来编辑调查问卷、收集数据的程序员都被整合在了具备洞察的组织中。然而,他们中的很多人都没有接受过数学或统计学的正统培训。同样地,那些面向客户并具有数值定量头脑的商务人才在团队构建中也应当有一席之地。培训现有数学或统计学人才是可行的,但漫长的过程需要极强的耐心。如果组织认可且相信他们已有的人才并且选择这条路来组建团队,这也就指向了需要填补的空白从而打造完美团队。

组织机构很久之前就知道数据的价值了,但如果没有人的参与,无论数据量有多大,细节有多深,到2019年实现数据科学300亿美金的估值都是很难的。一个互相平衡的团队对各类数据作出的解读、过滤以及修正都会加速这种成长并提升数据科学的重要性。

许多人觉得Hilary的“酷呆瓜”概念只适用于个人。但实际上,我们必须认识到团队的集体“酷”也是充满潜力的。

当组织在组建和招聘数据科学团队时,或许团队宗旨可以简单的称为“如果你能找到呆瓜,那就留住他们。但如果缺少聚集了各类独角兽人才的团队,那就创造一个。”

内容来源:数据观

原文发布于微信公众号 - 灯塔大数据(DTbigdata)

原文发表时间:2016-12-08

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏DT数据侠

想做“开放数据”这门大生意?先让数据“关联”起来

随着“开放数据”这项运动在中国的持续进行,各类开放的数据逐渐丰富起来。如何解决其中的数据孤岛难题?又如何最大化挖掘开放数据的商业价值?10月30日的线上数据侠实...

9500
来自专栏PPV课数据科学社区

大数据时代八大热门IT岗位

新的想法诞生新的技术,从而造出许多新词,云计算、大数据、BYOD、社交媒体、3D打印机、物联网……在互联网时代,各种新词层出不穷,令人应接不暇。 这些新的技术、...

36770
来自专栏大数据文摘

企业大数据如何起步:从小数据到大数据

267110
来自专栏量子位

阿里发布藏经阁计划:一年建成知识引擎服务平台

最近,阿里联合清华大学、浙江大学、中科院自动化所、软件所、苏州大学等五家机构,联合发布藏经阁(知识引擎)研究计划。

14220
来自专栏华章科技

车品觉:大数据的“上半场”与“下半场”

从PC互联网到移动互联网,再到智能互联网,技术背后更多体现的是解决问题的思维方式的变革。当大数据被广泛应用并逐渐走到下半场的时候,对于公司或产品,我们面临怎样的...

12630
来自专栏PPV课数据科学社区

☞【观点】成为“大数据企业”,献给不懂数据挖掘的你

文|郭迅华:清华大学经济管理学院副教授 一家中等规模的百货商场,通过视频监控记录下商场各个区域的客流人数,从而评估每天各个时段客流的在店时长,进而结合销售记录...

36070
来自专栏IT派

软技能和硬技能哪个重要?科技行业需要重新思考这个问题

IT派 - {技术青年圈} 持续关注互联网、大数据、人工智能领域 最近我看到很多技术人员非常焦虑,认为他们的「核心技能」可能会失去价值,尤其是在没有其他方...

35050
来自专栏罗超频道

地图3.0时代:百度乘风而上,腾讯、阿里跟进

最近,高德一封公开的“内部信”让整个互联网圈都将目光聚焦在了地图身上。在“内部信”中老俞高调宣扬同比增长120%的用户数据及十一当天过亿的导航规划服务次数等数据...

397100
来自专栏ATYUN订阅号

Oracle公司深入AI领域:收购机器学习平台DataScience.com

Oracle公司今天宣布收购了DataScience.com,这是一个数据科学项目和工作负载的私有云平台。

14840
来自专栏人工智能快报

调查显示美国人较能接受工作场合的生物识别应用

生物识别资讯网站findbiometrics于2016年1月14日报道,美国民间独立调查机构皮尤研究中心最新的一项研究结果显示,美国人对面部识别技术可能并没有部...

35580

扫码关注云+社区

领取腾讯云代金券