12个数据科学面试必问问题

原作者 Venkat Nagaswamy

编译 CDA 编译团队 本文为 CDA 数据分析师原创作品,转载需授权

聘用到出色的数据科学家至关重要,但这并非易事。本文从面试公司的角度,列出了数据科学相关职位面试时必问的一些问题,相信应聘者也能从中得到启示。

根据 IDC 最近的一项研究预测,到 2018 年美国企业需要 181,000 名具有深厚分析能力、数据管理以及表述能力的人才。

那么面试时该如何筛选出最好的人才?

· 技术问题在面试中有一定作用,但只反映了他们技术知识的水平。

· 白板演示问题很有用,但是能否反映面试者面实际挑战时能够提供的真正价值?

为了在面试中更全面的评估数据科学家,在这里有一份偏重市场营销和客户分析的面试问题列表。旨在测试数据科学家的技术能力以及其他影响聘用的因素:思维敏捷捷性,灵感性和客观性。

1. 你最欣赏哪位数据科学家?为什么?

以这个问题作为开场是不错的选择,很多面试者很可能认为,在一开始会被问到技术问题,或一些相关工作或学术背景。但这是一个重要的问题,因为他们应该对这个领域有足够的认识,并了解该领域的重要人物,无论是目前还是历史上。

例如,以下是几个我们关注的数据科学家,以及原因:

John Snow(不是“权力的游戏”那个)发现了伦敦 1840-1850 年期间的霍乱疫情,他通过统计学和点示图证明该疾病是如何聚集在公共水泵上,从而污染了泰晤士河水。

Hilary Mason,在创 立Fast Forward Labs 前,在 bitly 担任4年首席数据科学家,被 Fast Company 评为“100位商界最具创意者”。

Peter Skomoroch,LinkedIn Skills 创始人,Skipflag 创始人、首席执行官; 在LinkedIn 之前,任 Juice Analytics 的高级分析总监,AOL Search 的高级研究工程师。

2. 如何证明你对算法做的改进比改进前更好?

一个好的数据科学家不应该让自大或不安影响其经验判断,因此他们应该有一个严谨的分析框架,用于评估每次改进。换句话说,他们进行自我审核时,对自己需比他人更严格。比如:

· 用于性能比较的数据中是否存在选择偏差?

· 受控实验的方法是否被遵循?

· 是否应用了 A /B 测试?

· 我的测试数据是否有足够的多样性以代表真实数据以避免过度拟合)?

· 结果是否可重复?

3. 你将如何使用数据来改进我们的网站?

Airbnb 的前数据科学负责人 Riley Newman 对于公司如何利用数据科学的问题给出了很好的回答:“ Airbnb 将数据视为客户的声音,而数据科学则是对该声音的解读。”

通过这个问题,可以了解面试者将如何利用访问者、客户网站的使用趋势或其他数据,并改进营销或内容接触点。

这也显示了他们是否真正了解面试公司。

4. 详细描述你最近完成的一个项目,以及雇主是如何使用当中的发现的?

如果面试者不能回答这个问题,说明他们并不是真心诚意像得到这份工作。另外,如果他们不愿意回答这个问题,那就是一个危险的信号。说明没有必要与其分析详细或机密数据。

劳动力管理公司 Kronos 的数据科学家 Tom Walsh 表示“业余者谈论到项目过程时会透露当中弱点。但是一位真正的数据科学家能够提供他们在项目阶段每一步的见解。”

针对应届毕业生,可以询问有关学校研究项目或论文的类似问题。

5. 你能举实例说明,如何把创意应用于数据科学吗?

在大数据世界中,敏捷性和创造力至关重要。当需要充分利用这些数据时,你应该调动其想象力并保持开放心态。一个伟大的数据科学家总能假设并建立模型。

补充的问题可以是询问面试者在过去工作中应用了什么模式和过程。如果他们一直采取相同的解决方案,那未必是件好事:这可能表明他们不愿意或不能创新的迹象。

6. 你对竞争情报有多熟悉?举个例子。

如果你是看中产品开发,市场营销等能力招聘他们的话,面试者最好能够证明他们熟悉收集和分析竞争环境的各个方面的工具,从产品、客户再到竞争对手。

不仅仅是知道使用 Alexa,Compete 或 Google Trends 等工具。最重要的是弄清楚面试者过去实际做过的事情,从而提供可行的见解。

7. 如果他人很难理解你的模型时,你将如何有效地传达其关键信息?

当向高层和股东解释其发现时,数据科学家认为很好理解的内容,常常可能让其他人感到很费解。

在任何公司企业中各种决策者的理解能力都不同,因此数据科学家需要能够清晰的讲解发现和观点。

8. 你将如何对完全没有基础的人解释线性回归?

这与前一个问题的目的类似:检测面试者如何将复杂的概念以浅显易懂的方式解释给他人。除了“线性回归”,还可以将术语改为“机器学习”“ ROC 曲线”等等。

9. 你将如何社交媒体融入到你的工作中?

如果工作中涉及到消费者、客户分析的方面,包括 B2B ABM,那么社交媒体则提供了一个实时样本集,这对任何品牌以及营销人员来说都是十分重要的。

面试者需要对如何利用社交媒体数据有明确见解。你希望他们在当中投入多少精力取决于实际情况和业务模式,但由于社交媒体是各个行业的关键渠道,因此面试者需要能够充分利用社交数据。

10. 请解释哪种数据科学的“最佳实践”与这项工作紧密相关?为什么?

特别是当雇用高级职位时,这对于事先努力熟悉业务和行业操作的面试者而言,这是一个不容错过的问题。

此外,如果是管理职位的话,那么更值得考验其与下属和供应商进行沟通和执行的能力。

11. 判定开发数据模型是否良好的标准是什么?

这可以作为技术问题之一。在这种情况下,面试者应该能够轻松地说出它需要具有可预测的性能,可以轻松适应业务需求的任何改变,是可扩展的,并提供可操作的结果。

你可以测试面试者关于 Hadoop、Spark 的各种知识,以及 Python,R ,SAS 等编程语言的知识,或者关于数据再加工,数据可视化,机器学习等问题。

12. 如何利用机器学习解决如下问题:当地一家船运公司发现无法准时送货。什么算法可以解决该问题?

这是一个棘手的问题,旨在测试他们对机器学习应用的的基本理解。这是一个路径优化问题,而不是机器学习问题,可以用数学方法解决。相反,机器学习问题具有模式和数据,无法通过构造方程来解决。

在面试中,问一两次这种问题是可以的,因为这揭示了面试者是否真正掌握了在特定情况下适用的分析工具。

原文链接:

https://medium.com/@venkatnagaswamy/12-must-ask-questions-to-ask-a-data-scientist-job-candidate-626ee2cc62d9

原文发布于微信公众号 - CDA数据分析师(cdacdacda)

原文发表时间:2017-06-30

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏大数据文摘

关于数据分析,管理者的4个常规错误

15230
来自专栏钱塘大数据

【干货】从初级到高级,大数据研究常用软件工具推荐

导读:如今,大数据日益成为研究行业的重要研究目标。面对其高数据量、多维度与异构化的特点,以及分析方法思路的扩展,传统统计工具已经难以应对。 工欲善其事,必先利...

442110
来自专栏AI科技大本营的专栏

谷歌收购Kaggle平台案背后精明的人工智能策略

上月初,谷歌宣布其正收购科学数据平台kaggle。其中,kaggle平台的许多评论家以及新闻报道者也以吸收人才的方式一并被收购。与此同时,kaggle平台目前也...

33640
来自专栏数据科学与人工智能

【数据科学】如何区分大数据下的三大利器:数据科学家,数据工程师与数据分析师。

与其他一些相关工程职位一样,数据科学家的影响力与互联网同进同退。数据工程师和数据分析师与数据科学家携手共同完成这幅“大数据时代”巨作。他们共同努力拟定数据平台要...

27790
来自专栏大数据文摘

研究了数千个在线课程,我整理了一份数据科学入门课清单

1.3K100
来自专栏WeTest质量开放平台团队的专栏

游戏人工智能 读书笔记(一)前言与介绍

自人工智能诞生之始,就和游戏紧密的相结合在一起。因为人们通常认为,人类玩游戏的过程是蕴含着人类的智能的。因此,当人们创造出一个能够完成人类的某种游戏的程序,我们...

11340
来自专栏腾讯游戏云的专栏

内行看门道:看似“佛系”的《QQ炫舞手游》,背后的音频技术一点都不简单

3月14日,腾讯旗下知名手游《QQ炫舞》正式上线各大应用商店,并迅速登上App Store免费游戏总榜第一位。作为一代玩家的青春记忆,早在游戏发布前,《QQ炫舞...

46430
来自专栏华章科技

大数据入门,你需要懂这四个常识

大数据分析的使用者有大数据分析专家,同时还有普通用户,但是他们二者对于大数据分析最基本的要求就是可视化分析,因为可视化分析能够直观的呈现大数据特点,同时能够非常...

9430
来自专栏量子位

详解:知乎如何使用机器学习,未来还有哪些想象空间

舒石 假装发自 斯坦福 量子位 报道 | 公众号 QbitAI 机器学习,正在以及将要如何改变知乎? 回答这个问题的最佳人选,莫过于知乎合伙人、大数据团队负责人...

354110
来自专栏吉浦迅科技

Amazon进军AI主战场,力争AI大饼

Amazon在AWS re:Invent大会宣布推出3项云端AI服务,将Amazon内部采用的机器学习与深度学习技术,以云端服务的型式提供给所有非机器学习专家的...

34180

扫码关注云+社区

领取腾讯云代金券