前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >12个数据科学面试必问问题

12个数据科学面试必问问题

作者头像
CDA数据分析师
发布2018-02-26 16:13:32
1K0
发布2018-02-26 16:13:32
举报
文章被收录于专栏:CDA数据分析师

原作者 Venkat Nagaswamy

编译 CDA 编译团队 本文为 CDA 数据分析师原创作品,转载需授权

聘用到出色的数据科学家至关重要,但这并非易事。本文从面试公司的角度,列出了数据科学相关职位面试时必问的一些问题,相信应聘者也能从中得到启示。

根据 IDC 最近的一项研究预测,到 2018 年美国企业需要 181,000 名具有深厚分析能力、数据管理以及表述能力的人才。

那么面试时该如何筛选出最好的人才?

· 技术问题在面试中有一定作用,但只反映了他们技术知识的水平。

· 白板演示问题很有用,但是能否反映面试者面实际挑战时能够提供的真正价值?

为了在面试中更全面的评估数据科学家,在这里有一份偏重市场营销和客户分析的面试问题列表。旨在测试数据科学家的技术能力以及其他影响聘用的因素:思维敏捷捷性,灵感性和客观性。

1. 你最欣赏哪位数据科学家?为什么?

以这个问题作为开场是不错的选择,很多面试者很可能认为,在一开始会被问到技术问题,或一些相关工作或学术背景。但这是一个重要的问题,因为他们应该对这个领域有足够的认识,并了解该领域的重要人物,无论是目前还是历史上。

例如,以下是几个我们关注的数据科学家,以及原因:

John Snow(不是“权力的游戏”那个)发现了伦敦 1840-1850 年期间的霍乱疫情,他通过统计学和点示图证明该疾病是如何聚集在公共水泵上,从而污染了泰晤士河水。

Hilary Mason,在创 立Fast Forward Labs 前,在 bitly 担任4年首席数据科学家,被 Fast Company 评为“100位商界最具创意者”。

Peter Skomoroch,LinkedIn Skills 创始人,Skipflag 创始人、首席执行官; 在LinkedIn 之前,任 Juice Analytics 的高级分析总监,AOL Search 的高级研究工程师。

2. 如何证明你对算法做的改进比改进前更好?

一个好的数据科学家不应该让自大或不安影响其经验判断,因此他们应该有一个严谨的分析框架,用于评估每次改进。换句话说,他们进行自我审核时,对自己需比他人更严格。比如:

· 用于性能比较的数据中是否存在选择偏差?

· 受控实验的方法是否被遵循?

· 是否应用了 A /B 测试?

· 我的测试数据是否有足够的多样性以代表真实数据以避免过度拟合)?

· 结果是否可重复?

3. 你将如何使用数据来改进我们的网站?

Airbnb 的前数据科学负责人 Riley Newman 对于公司如何利用数据科学的问题给出了很好的回答:“ Airbnb 将数据视为客户的声音,而数据科学则是对该声音的解读。”

通过这个问题,可以了解面试者将如何利用访问者、客户网站的使用趋势或其他数据,并改进营销或内容接触点。

这也显示了他们是否真正了解面试公司。

4. 详细描述你最近完成的一个项目,以及雇主是如何使用当中的发现的?

如果面试者不能回答这个问题,说明他们并不是真心诚意像得到这份工作。另外,如果他们不愿意回答这个问题,那就是一个危险的信号。说明没有必要与其分析详细或机密数据。

劳动力管理公司 Kronos 的数据科学家 Tom Walsh 表示“业余者谈论到项目过程时会透露当中弱点。但是一位真正的数据科学家能够提供他们在项目阶段每一步的见解。”

针对应届毕业生,可以询问有关学校研究项目或论文的类似问题。

5. 你能举实例说明,如何把创意应用于数据科学吗?

在大数据世界中,敏捷性和创造力至关重要。当需要充分利用这些数据时,你应该调动其想象力并保持开放心态。一个伟大的数据科学家总能假设并建立模型。

补充的问题可以是询问面试者在过去工作中应用了什么模式和过程。如果他们一直采取相同的解决方案,那未必是件好事:这可能表明他们不愿意或不能创新的迹象。

6. 你对竞争情报有多熟悉?举个例子。

如果你是看中产品开发,市场营销等能力招聘他们的话,面试者最好能够证明他们熟悉收集和分析竞争环境的各个方面的工具,从产品、客户再到竞争对手。

不仅仅是知道使用 Alexa,Compete 或 Google Trends 等工具。最重要的是弄清楚面试者过去实际做过的事情,从而提供可行的见解。

7. 如果他人很难理解你的模型时,你将如何有效地传达其关键信息?

当向高层和股东解释其发现时,数据科学家认为很好理解的内容,常常可能让其他人感到很费解。

在任何公司企业中各种决策者的理解能力都不同,因此数据科学家需要能够清晰的讲解发现和观点。

8. 你将如何对完全没有基础的人解释线性回归?

这与前一个问题的目的类似:检测面试者如何将复杂的概念以浅显易懂的方式解释给他人。除了“线性回归”,还可以将术语改为“机器学习”“ ROC 曲线”等等。

9. 你将如何社交媒体融入到你的工作中?

如果工作中涉及到消费者、客户分析的方面,包括 B2B ABM,那么社交媒体则提供了一个实时样本集,这对任何品牌以及营销人员来说都是十分重要的。

面试者需要对如何利用社交媒体数据有明确见解。你希望他们在当中投入多少精力取决于实际情况和业务模式,但由于社交媒体是各个行业的关键渠道,因此面试者需要能够充分利用社交数据。

10. 请解释哪种数据科学的“最佳实践”与这项工作紧密相关?为什么?

特别是当雇用高级职位时,这对于事先努力熟悉业务和行业操作的面试者而言,这是一个不容错过的问题。

此外,如果是管理职位的话,那么更值得考验其与下属和供应商进行沟通和执行的能力。

11. 判定开发数据模型是否良好的标准是什么?

这可以作为技术问题之一。在这种情况下,面试者应该能够轻松地说出它需要具有可预测的性能,可以轻松适应业务需求的任何改变,是可扩展的,并提供可操作的结果。

你可以测试面试者关于 Hadoop、Spark 的各种知识,以及 Python,R ,SAS 等编程语言的知识,或者关于数据再加工,数据可视化,机器学习等问题。

12. 如何利用机器学习解决如下问题:当地一家船运公司发现无法准时送货。什么算法可以解决该问题?

这是一个棘手的问题,旨在测试他们对机器学习应用的的基本理解。这是一个路径优化问题,而不是机器学习问题,可以用数学方法解决。相反,机器学习问题具有模式和数据,无法通过构造方程来解决。

在面试中,问一两次这种问题是可以的,因为这揭示了面试者是否真正掌握了在特定情况下适用的分析工具。

原文链接:

https://medium.com/@venkatnagaswamy/12-must-ask-questions-to-ask-a-data-scientist-job-candidate-626ee2cc62d9

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2017-06-30,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 CDA数据分析师 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档