九个成为数据科学家的必备技能

本文详细列举了从雇主角度看来,数据科学家加强自身市场竞争力所必备的9个数据科学技能。

过去一年中人们对数据科学的兴趣骤然增长。Nate Silver这个名字已经家喻户晓,所有公司都在寻找独角兽,很多不同学科的专业人才都开始关注这份薪水丰厚的职业,并将其当作自己可能的职业选择。

在Burtch Works开展招聘工作时,我们与很多想要在数据科学这一成长性领域有所发展的分析学专家探讨过,对具体的实施方案提出了疑问。我从招聘者的角度列出了在数据科学方面对成功十分关键,并且是招聘经理首先考虑的一些技术类与非技术类技能。

各公司在技能与工具的价值评判上都不尽相同,因此这个列表绝对谈不上详尽,不过在这些领域有过经验的人会在数据科学上占有更大的优势。

技术技能:分析学

1教育

数据科学家受教育程度都很高,其中88%至少拥有硕士学位,46%有博士学位。虽然有一些名人特例,不过通常来说成为一名数据科学家需要扎实的教育背景,才能掌握所需的深度知识。最常见的研究领域包括数学与统计学(32%),其次是计算机科学(19%)以及工程学(16%)。

2SAS软件与/或R语言

对其中至少一种分析工具有深入的了解,一般对数据科学来说R语言更好一些。

技术能力:计算机科学

3语言要求

都是公司在招聘数据科学类角色时最常提出的语言要求。

4Hadoop平台

尽管不是总有这个需求,不过在很多情况下掌握它的人优势更大。熟悉Hive或Pig也是很有利的卖点。熟悉类似Amazon S3这样的云工具也会很有优势。

5SQL数据库/编程

尽管NoSQL和Hadoop已经成为了数据科学很大的组成部分之一,招聘者还是希望能够找到可以编写与执行SQL复杂查询的候选人。

6非结构化数据

数据科学家能够处理非结构化数据这一点非常重要,无论这些数据是来自社交媒体、视频源或者音频的。

非技术类技能

7求知欲

毫无疑问最近到处都能看到这个词,尤其是在与数据科学家关联时。Frank Lo在几个月前的博文中描述了这个词的含义,并且讨论了其他必须的“软技能”。

8商业智慧

想要成为数据科学家,需要充分了解自己工作的行业,并且知道公司想要解决的商业问题是哪些。能够根据数据科学分辨出解决哪些问题对公司来说更为重要,并且能够找出利用数据的新办法,这些是非常关键的。

9通用技能

寻找优秀数据科学家的公司想要的是这样的人材:能够清楚顺畅地将自己的技术发现转化为非技术团队(比如市场部或者销售部)能够使用的内容。数据科学家必须能得出可用以决策的量化insight,同时了解非技术团队的需求,可以恰当地进行沟通以传达数据。想要了解定量专家在沟通技巧方面的更多信息,请参见我们近期的调查。

◆ ◆ ◆ ◆

一般接下来的问题都是:“怎样能够获得这些技能呢?”网上有很多资源,不过笔者不希望让读者产生这样的错觉——成为数据科学家非常简单,上几节MOOCs就够了。除非你有扎实的定量经验,否则成为数据科学家之路还是颇有挑战的——但也并非不可能。

不过只要你确实对数据有兴趣、有激情,并打算将生命投入到相关的学习上,那么就不要让经验背景成为你追求数据科学生涯的阻碍。下面是我们觉得有用的一些资源:

1高等学位——为了满足目前的需求,如雨后春笋般出现了更多的数据科学专业的项目,不过数学、统计学与计算机科学专业的项目也有很多。

2MOOCs——Coursera、Udacity还有codeacademy都是不错的入门方式。

3证书——KDnuggets编写了一个很长的列表清单。

4Bootcamps——想要了解这种方式与学历项目或MOOCs的对比情况。

5Kaggle——Kaggle上有数据科学竞赛,可以进行演练,用杂乱的真实世界数据来磨练技巧,解决真实的商业问题。雇主对Kaggle排名很重视,该排名可以被看作是相关的、经过亲身实践的项目工作。

6LinkedIn小组——加入相关的小组,与数据科学社区的其他成员互动。

7数据科学中心与KDnuggets——数据科学中心与KDnuggets都是保持与数据科学行业趋势前沿同步的优秀资源。

8Burtch Works研究:关于数据科学家的薪金,如果想要了解更多信息与当前数据科学家人数统计的话,请下载我们的数据科学家薪金研究报告。

原文发布于微信公众号 - 大数据(hzdashuju)

原文发表时间:2015-12-25

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏新智元

【首发】人工智能与设计的未来报告:100个案例,50位专家,1000份问卷告诉你设计领域人机深层关系(下载)

【新智元导读】 2017年4月27日,由“同济×特赞设计与人工智能实验室”撰写的《设计与人工智能报告》在阿里巴巴UCAN 用户体验设计峰会上发布。这份报告回顾了...

4007
来自专栏大数据文摘

五张图区分商业分析师与数据科学家

2947
来自专栏大数据文摘

数字驱动教育:未来的教室应该是什么样的

2205
来自专栏新智元

深度学习市场分析报告: 图像识别主导,市场份额超40%

【新智元导读】市场研究&咨询公司Grand View Research的报告从行业、解决方案、硬件、应用程序、终端使用、区域等方面对深度学习进行了评估及趋势分析...

5328
来自专栏CDA数据分析师

不知道 AI 这三点优势,你可能真的要被淘汰!

我们正处于飞速发展的数字化转型时期,这是由巨大的市场转变驱动的——即人工智能和机器学习。

1092
来自专栏程序员的知识天地

周鸿祎谈创业:很多程序员高智商但我一看就知道他们不会成功

很多人都向往着有一天自己创业,程序员更是如此。如果你想创业,那么该怎样创业,需要有哪些准备,自己还有什么不足等等这些问题你考虑过吗?本文就跟大家分享周鸿祎在接受...

2090
来自专栏BestSDK

在SaaS应用中,AI的“雪球”如何越滚越大?

从Shopify可防止欺诈的机器学习到Salesforce的Einstein,在过去的数年间,SaaS巨头们或投入巨资以进行AI的开发,或收购AI创业公司,以试...

3749
来自专栏SAP最佳业务实践

从SAP最佳业务实践看企业管理(10)-CRM

假如你是一个销售,你知道你和客户处于什么阶段吗? 客户生命周期描述了客户关系水平随时间变化的发展轨迹,它描述了客户关系从一种状态(一个阶段)向另一种状态(另一...

3046
来自专栏大数据文摘

【御数之旅-5】企业数据世界论坛结题篇:洞察行业趋势,倾听中国好声音

1201
来自专栏钱塘大数据

做数据挖掘工作需要具备的五大思维原理

一、数据核心原理 从“流程”核心转变为“数据”核心 大数据时代,计算模式也发生了转变,从“流程”核心转变为“数据”核心。Hadoop体系的分布式计算框架已经是“...

2584

扫码关注云+社区

领取腾讯云代金券