专栏首页浊酒清味数据科学工程师面试准备指南(国际版)

数据科学工程师面试准备指南(国际版)

前言

与其他技术面试一样,数据科学面试也需要大量的准备工作。比如你需要知道统计、编程和机器学习的知识。今天就为大家盘点一下该做什么样的准备。

小窍门

在我们开始之前,我想分享一个小窍门。

我注意到公司进行的数据科学面试有几种类型。一些数据科学面试是产品驱动的。这些面试更多地关注于询问产品问题,比如您将使用什么样的度量标准来显示您应该在产品中改进什么。这些问题通常与SQL和一些Python问题一起出现。

另一种类型的数据科学面试往往是将编程和机器学习结合。

我们建议,如果你不确定自己将面临哪种类型的面试,不妨问问招聘人员。有些公司非常善于保持面试的一致性,但即使这样,团队也会根据他们寻找的内容而有所偏离。以下是一些我们注意到的关于一些公司数据科学面试的例子:

  • Airbnb -大量的产品,指标诊断,指标创建,A/B测试,大量的行为问题。
  • Netflix,A/B测试,实验设计,度量设计
  • 微软-大量编程,二叉树遍历,SQL,机器学习
  • Expedia,编程,SQL,产品感,机器学习问题,支持向量机,回归和决策树

准备清单

由于这种差异,我们创建了一个清单,以跟踪您研究了哪些主题领域,以及您还需要覆盖哪些内容。

让我们首先确保您能够解释基本的数据科学算法。

机器学习算法

  • 决策树:

http://www.acheronanalytics.com/acheron-blog/brilliant-explanation-of-a-decision-tree-algorithms

  • SVM:

https://towardsdatascience.com/support-vector-machine-introduction-to-machine-learning-algorithms-934a444fca47

  • 主成分分析

https://setosa.io/ev/principal-component-analysis/

  • AdaBoost:

https://machinelearningmastery.com/boosting-and-adaboost-for-machine-learning/

  • 贝叶斯网络:

http://horicky.blogspot.com/2009/05/machine-learning-probabilistic-model.html

  • 神经网络:

http://horicky.blogspot.com/2009/11/machine-learning-with-linear-model.html

  • 降维算法:

https://elitedatascience.com/dimensionality-reduction-algorithms

概率和统计

在大型科技公司,偶然被问到一个概率或统计问题是很常见的。虽然这些问题并不一定需要复杂的数学运算,但如果你还没有考虑到独立和相关的概率,那么最好复习一下基本的公式。

下面是一些基本概念的文章列表

bias-variance trade-off:

https://towardsdatascience.com/understanding-the-bias-variance-tradeoff-165e6942b229

混淆矩阵(confision matrx):

https://www.dataschool.io/simple-guide-to-confusion-matrix-terminology/

ROC曲线:

https://www.dataschool.io/roc-curves-and-auc-explained/

P-value:

https://www.khanacademy.org/math/ap-statistics/tests-significance-ap/idea-significance-tests/v/p-values-and-significance-tests

斯皮尔曼相关性:

http://www.statstutor.ac.uk/resources/uploaded/spearmans.pdf

正态分布问题:z scole:

https://www.khanacademy.org/math/statistics-probability/modeling-distributions-of-data/z-scores/v/ck12-org-normal-distribution-problems-z-score?modal=1

产品及实验设计

产品感是数据科学家的一项重要技能。知道如何衡量新产品以及为什么可以帮助确定一个产品是否表现良好。有趣的是,有时某些指标按照您希望的方式进行可能并不总是好的。人们花更多时间在你的网站上的原因可能是因为网页加载时间更长或其他面临类似问题。这就是为什么度量很复杂,而度量的内容很重要的原因。

用户参与度指标:

https://mixpanel.com/topics/important-user-engagement-metrics-apps/

A / B测试指南:

https://cxl.com/AB-Testing-Guide-ConversionXL.pdf

度量主题:

https://www.productschool.com/blog/product-management-2/interview/answering-metrics-interview-question-product-management/

算法和数据结构

下图总结了一些常见的数据结构:

SQL

一般来说,至少会有一次针对SQL的采访。此外,面试官可能会带你经历开发产品的整个过程,选择要跟踪的指标,然后查询该指标的有效性。下面是一些leetcode问题清单:

旅行和用户:

https://leetcode.com/problems/trips-and-users/

体育馆的人流:

https://leetcode.com/problems/human-traffic-of-stadium/

部门前三名:

https://leetcode.com/problems/department-top-three-salaries/

交换座位:

https://leetcode.com/problems/exchange-seats/

总结

技术面试可能很难。无论是软件工程师、数据工程师还是数据科学家。我们希望这个学习指南能帮助你跟踪你的进步!

·END·

本文分享自微信公众号 - Python与机器学习之路(gh_39aead19f756),作者:Huangwei AI

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2020-04-03

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 2019年11月最佳开源项目调查结果

    让我来介绍一下2019年11月发现的最好的开源项目。这次,我们介绍的开源项目不止有Python,还有很多别的语言。

    HuangWeiAI
  • 笑死人不偿命的知乎沙雕问题排行榜

    作者:徐麟,某互联网公司数据分析狮,个人公众号数据森麟(id:shujusenlin)

    HuangWeiAI
  • Python中多线程和多处理的初学者指南

    使用Python分析数据,如果使用了正确的数据结构和算法,有时可以大量提高程序的速度。实现此目的的一种方法是使用Muiltithreading(多线程)或Mul...

    HuangWeiAI
  • 网页显示3D模型 原

    中文网教程:http://www.hewebgl.com/article/articledir/1

    晓歌
  • fiddler mock ==> AutoResponder

    背景 做过测试的同学,肯定都听过fiddler的大名,抓包工具,app抓包 下载传送门(https://www.telerik.com/download/fid...

    千往
  • 架构设计理念&模型

    今天我们还需要关注 DDD 吗?https://www.infoq.cn/article/should-we-focus-on-ddd

    xiaoxi666
  • 字节、百度等大厂面经,资深服务端工程师谈跳槽感悟

    今天大鹏请来一位大厂有 4 年工作经验的服务端资深工程师,在2020年多事之秋的节点,跟大家谈一下跳槽感悟,分享一下自己的面试经历

    灵魂画师牧码
  • 可以Online Coding的网站哦

    起初是今天问了方老师一个问题,后来方老师贴了个链接,真好用。遂研究了下,还有就是上次旭鸿大哥给我的一个面试链接,能够看到面试者的实时答题情况,今天心血来潮想研究...

    丰臣正一
  • 《每日一荐月刊》2020-01

    尤雨溪在多伦多的演讲《Vue 3.0 设计原则》对于想要学习 Vue3.0 或者想要直接从零开发 Vue3.0 的人来说,绝对是必读的。PPT 内容不多,几分钟...

    lucifer210
  • 2020 给你 8 个接私活的网站

    2019互联网圈不好混,不是每个公司都能像腾讯云每人一部iPhone 11,不少公司今年已经没了年终奖,不要抱怨,因为有的小伙伴估计工作都没了。师长今天给大家推...

    逆锋起笔

扫码关注云+社区

领取腾讯云代金券