专栏首页牛客网数据挖掘算法工程师面经

数据挖掘算法工程师面经

走到现在,校招已经过了一半,自己心仪的公司也基本都走完了校招流程,我的校招随之已经结束了,在家中陪着父母过一个长假。闲下来,想远离代码,远离算法,好好的放松下自己,假期后要开始论文的征程了。找个空闲,给那些正在奋斗找工作的同学们和学弟学妹们,一点参考。

先来介绍下我吧,某211大学渣本硕,中间出去工作过两年,从事的行业与现在无关,可忽略。所有算法和编程都是入学以后学的,专硕,两年,现已过一年,寻找工作中,现已定去向。

我主要是算法方向,专业是统计学,可能我们更偏向于算法的优化,而在计算机的数据结构优化方面没有很深的理解。其中学习了java,python基本语言,算法方面主要是机器学习算法,深度学习有所了解,工程能力方面还有JS,CSS等web知识,MySQL数据库,Linux操作系统以及最重要的数据结构。优点就是爱刷算法题,笔试没啥问题。

春招时候,也是实习生招聘的时候,怀着远大的抱负,所有互联网行业全部被PASS。其中收到面试只有腾讯,阿里,头条,但都只是一面PASS。由此可见,算法功底还是不够,毕竟才学了半年。

通过实习僧,先后在中科院和平安科技实习4个月左右,特别是在平安科技,感觉提升很大,从一个只会写编程题的低等猿,到了一个可以一天写几百行的中等猿,可以独立完成一个算法,从数据处理,特征提取到模型建立,评判模型等都可以写。从此就走上了码农的道路。

到重点了!!!前面都是铺垫。通过各种关系,在这里要感谢很多大佬,首先就是威哥帮我内推了10家以上,还有百度爷路子,腾讯大佬飞飞还有360师姐等的内推,不管内推结果如何,很感谢大家。拿下的内推只有360,好未来和拼多多。校招批,拿下了三个面试机会,分别是搜狗,百度,苏宁。前面的铺垫是有必要的,因为那些被一面pass的公司都没给我面试机会,不知为何,华为简历都没过。

6个面试,3个offer:

1、360安全研究院数据挖掘工程师。(一面视频面 70分钟 gg)

自我介绍

项目介绍(数据预处理,特征选择方法,xgboost与GBDT区别(算法到内存),评价指标有哪些,项目上没上线)

朴素贝叶斯推导,优缺点

决策树(ID3,C4.5,CART)原理,信息增益公式推导,信息增益比的引入原因,Gini指数的用途和原理

随机森林原理,优缺点

随机森林与GBDT

Adaboost原理

Logistic回归推导,损失函数,优缺点

SVM推导,损失函数,优缺点

Kmeans聚类原理,k值的确定方法,优缺点

算法题1:一个数组找寻某个数(二分法)

算法题2:双向链表什么什么的(不懂)

你有什么问题需要问我的吗?(我只有一个问题,贵部门主要是做什么的,我进去我的岗位大概会是什么?)

总结:很专业很正式的一场面试,感觉到了强大的技术压力,第一个面试,让我简直快要放弃这个岗位了。但是很佩服,基础好扎实。

2、好未来数据挖掘机器学习工程师(一面17分钟 二面16分钟 都视频面offer)

一面:

自我介绍

项目介绍(。。。与上面差不多,就是没有问xgboost与GBDT区别)

你做过的项目中你比较熟悉什么算法,介绍下

开发方面接触多吗?看你会java

尬聊ing。。。

你有什么问题需要问我吗?(第一次回答,没有。。。)

总结:以为没有二面,但是过了4天接到了二面,二面在3天后。。。

二面:

自我介绍

项目介绍(。。。跟一面一样,不过问了好几个数据处理上的细节,有点专业,幸好我都懂,应付的过来)

RF的原理

还会其他的机器学习算法吗

我来介绍下我们部门的工作内容(balabala,说了5分钟。。。)

你有什么要问我的吗?(我心想,你都把我问题已经自己说完了,我有啥问题。。。)

那我接下来还有一个面试,就这样吧,具体的通知Hr会跟你联系。。。

总结:速战速决型。。。没想到就这样拿了一个提前批次offer

3、拼多多数据挖掘工程师(一面电话面 15分钟 gg)

自我介绍

项目介绍(一模一样的问题,问了几个核心的点,胸有成竹的答上来了)

RF原理,优化目标是什么!!!!!!(这个问题,我现在还没弄懂)

Kmeans聚类原理

朴素贝叶斯原理

决策树简介

了解推荐算法吗?给我介绍下这些算法怎么实现的?(懂是懂点。。。问题是没有做过相关的实现呀,懵逼ing)

算法题:如何层次遍历二叉树(据说用队列保存,遍历。。。没回答上来)

接着给我解释了下,然后就说今天的面试到此结束,再见!!!连让我问问题这个环节都没有了。。。gg

4、搜狗搜索事业部数据挖掘(一面二面+HR面 100分钟+40分钟 offer 已签)

一面+二面(面试我的直接就是主管,所以他说一面完,可以直接二面)

9点面试,8点半就到了,正好赶上主管去吃早饭,随口叫了我,正好我在,然后不吃饭拉我上去面试,真的很感动。大哥很和蔼,北方人。

进去后,直接说我先自我介绍下,然后就介绍了自己的部门,所做的事情,公司发展现状,这个岗位是干嘛的

自我介绍

项目介绍(互聊,感觉就是聊天的性质,很专业,每个点都问了一遍,四个项目,从背景到应用,聊到尴尬的地方就笑笑,对我工作两年的内容也很感兴趣,聊了很多工作内容,大概用了40分钟吧)

开始上技术了。。。

SVM的原理,推导,核函数的选举

调参的方法,方式

模型的选择原理

朴素贝叶斯可以做多分类吗?

RF原理

GBDT原理

对比两个的优缺点

过关了!!!我打了一个预防针,数据结构不怎么扎实,所以算法题给的没有牵扯到树,指针这类的。

算法题:一个矩阵,每一行,每一列数值都是递增的,寻找第k大的数

然后我就哗啦哗啦的写了一面的java代码,因为他说偏开发,最好以后多用java写,然后就给他秀了一波java。他说要看我代码风格。。。

接着问我框架懂不懂,多线程,异常抛出这些基础会不会。我说我就框架不会,其他的都学过,但是马上说了这个学起来不难,有算法的功底,很快就入手的。

回归到了机器学习,他问我python做数据挖掘没问题吧?我就实话实说了,numpy,pandas这些都用烂了,独立写一个算法从数据处理到模型建立都没问题,他就说其实不会数据结构也没啥,在数据处理和算法这块也用不上,效率不会在这优化。行吧,你还差一点点就能说服我,只要你说服了我,我就下去带你去见HR。。。

又来聊天了,聊当今互联网的发展,搜索的发展,反正就是侃。。。OK,走,见HR

总结:运气真好,碰到了一个这么和蔼的大哥,总之,感觉时间过得很快,很舒服的感觉。

HR面:

学历,职位,课程,参加了什么活动,班级排名

后不后悔考研只考了个211

对你影响最大的人是谁

工作期间内容是什么

期待薪资多少

有哪些offer

Ofo和摩拜,你更看好哪个

你有什么问题要问我的?

没了。。。等通知吧,9月底给答复

总结:反正就是聊天,也不知道筛不筛选,反正就是侃侃侃。

5、百度机器学习(一面 45分钟 gg)

自我介绍

算法题开始(我反问了句,要不要我们先聊聊项目,或者机器学习算法,面试官回了句,这是一面,面基础,面数据结构,二面才面算法)

第一题:一个堆,怎么按顺序改为一个双向链表(gg,根本不懂)

第二题:一个无序数组,用时间复杂最低的来寻找某两个数加起来等于一个固定的值m,输出这些对(完成的还行,就是申请空间过大)

面试到此结束。。。gg

6、苏宁云商算法工程师(面试 12分钟 offer)

自我介绍

项目介绍(里面问到了异常值处理,评价指标等)

挑选你最熟悉的算法介绍下

RF与决策树的对比(无语的问题。。。我反问了句,这就是父子的关系,会有啥对比的,估计他也意思到问错,所以马上换问题了)

RF与GBDT的区别(balabala,讲了7点,把他完全说服了,估计有些他都没听过)

现在手上有什么offer

班级排名多少

你还有什么问题?(老问题)

总结:这速度,还只有一面,简直了,预料到会过的,感觉他们得基础还没我好,嘿嘿,自恋一会,就这样拿到了第三个offer。

说到这里,也把我所有的面试全部说了一遍,可能因为个人能力加学校,很多好的公司都没给面试机会。所以我在这里建议学弟学妹们,在你们还有一年或者多年准备的时候,岗位也和我一样的话,我建议多搞几个竞赛,这样的话在简历筛选方面会更有优势。还有就是运气也是实力的一部分。

Offer选择,我也甚是纠结,既然做了决定,就这样吧。祝福还在校招的同学们,加油,一定会有自己心仪的公司的,祝福学弟学妹们,明年能更上一层楼!

作者:华仔17

本文来源于牛客网

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 阿里算法工程师面经

    牛客网
  • 左程云:程序员该如何学习算法?

    大家好,我是左程云。我本科就读于华中科技大学、硕士毕业于在芝加哥大学。先后在IBM、百度、GrowingIO和亚马逊工作,是一个刷题7年的算法爱好者,也是牛客网...

    牛客网
  • 记录第一次互联网面经Momenta

    牛客网
  • 一文看懂自动驾驶中应用的机器学习算法

    机器学习算法已经被广泛应用于自动驾驶各种解决方案,电控单元中的传感器数据处理大大提高了机器学习的利用率,也有一些潜在的应用,比如利用不同外部和内部的传感器的数据...

    CDA数据分析师
  • 这四类机器学习算法,在自动驾驶中常用

    机器学习算法已经被广泛应用于自动驾驶各种解决方案,电控单元中的传感器数据处理大大提高了机器学习的利用率,也有一些潜在的应用,比如利用不同外部和内部的传感器的数据...

    商业新知
  • 自动驾驶中常用的四类机器学习算法

    机器学习算法已经被广泛应用于自动驾驶各种解决方案,电控单元中的传感器数据处理大大提高了机器学习的利用率,也有一些潜在的应用,比如利用不同外部和内部的传感器的数据...

    刘盼
  • 视频 | 硅谷深度学习网红传授超参数优化宝典

    AI 研习社按:今天为大家带来硅谷深度学习网红 Siraj 在人工智能在线大会 AI WITH THE BEST(AIWTB)上的演讲,雷锋字幕组独家译制。本次...

    AI研习社
  • 一文看懂自动驾驶中应用的机器学习算法

    安妮 唐旭 编译自 KDnuggets 量子位出品 | 公众号 QbitAI 机器学习算法已经被广泛应用于自动驾驶各种解决方案,电控单元中的传感器数据处理大大提...

    量子位
  • 每周学点大数据 | No.2大数据的特点、应用和算法

    No.2期 大数据的特点、应用和算法 一、大数据的特点和应用 Mr. 王:大数据具有较大的数据量,和一般的数据相比,其具有如下一些特点。 ? —在数据量上,大...

    灯塔大数据
  • 阿里算法工程师面经

    牛客网

扫码关注云+社区

领取腾讯云代金券