数据挖掘算法工程师面经

走到现在,校招已经过了一半,自己心仪的公司也基本都走完了校招流程,我的校招随之已经结束了,在家中陪着父母过一个长假。闲下来,想远离代码,远离算法,好好的放松下自己,假期后要开始论文的征程了。找个空闲,给那些正在奋斗找工作的同学们和学弟学妹们,一点参考。

先来介绍下我吧,某211大学渣本硕,中间出去工作过两年,从事的行业与现在无关,可忽略。所有算法和编程都是入学以后学的,专硕,两年,现已过一年,寻找工作中,现已定去向。

我主要是算法方向,专业是统计学,可能我们更偏向于算法的优化,而在计算机的数据结构优化方面没有很深的理解。其中学习了java,python基本语言,算法方面主要是机器学习算法,深度学习有所了解,工程能力方面还有JS,CSS等web知识,MySQL数据库,Linux操作系统以及最重要的数据结构。优点就是爱刷算法题,笔试没啥问题。

春招时候,也是实习生招聘的时候,怀着远大的抱负,所有互联网行业全部被PASS。其中收到面试只有腾讯,阿里,头条,但都只是一面PASS。由此可见,算法功底还是不够,毕竟才学了半年。

通过实习僧,先后在中科院和平安科技实习4个月左右,特别是在平安科技,感觉提升很大,从一个只会写编程题的低等猿,到了一个可以一天写几百行的中等猿,可以独立完成一个算法,从数据处理,特征提取到模型建立,评判模型等都可以写。从此就走上了码农的道路。

到重点了!!!前面都是铺垫。通过各种关系,在这里要感谢很多大佬,首先就是威哥帮我内推了10家以上,还有百度爷路子,腾讯大佬飞飞还有360师姐等的内推,不管内推结果如何,很感谢大家。拿下的内推只有360,好未来和拼多多。校招批,拿下了三个面试机会,分别是搜狗,百度,苏宁。前面的铺垫是有必要的,因为那些被一面pass的公司都没给我面试机会,不知为何,华为简历都没过。

6个面试,3个offer:

1、360安全研究院数据挖掘工程师。(一面视频面 70分钟 gg)

自我介绍

项目介绍(数据预处理,特征选择方法,xgboost与GBDT区别(算法到内存),评价指标有哪些,项目上没上线)

朴素贝叶斯推导,优缺点

决策树(ID3,C4.5,CART)原理,信息增益公式推导,信息增益比的引入原因,Gini指数的用途和原理

随机森林原理,优缺点

随机森林与GBDT

Adaboost原理

Logistic回归推导,损失函数,优缺点

SVM推导,损失函数,优缺点

Kmeans聚类原理,k值的确定方法,优缺点

算法题1:一个数组找寻某个数(二分法)

算法题2:双向链表什么什么的(不懂)

你有什么问题需要问我的吗?(我只有一个问题,贵部门主要是做什么的,我进去我的岗位大概会是什么?)

总结:很专业很正式的一场面试,感觉到了强大的技术压力,第一个面试,让我简直快要放弃这个岗位了。但是很佩服,基础好扎实。

2、好未来数据挖掘机器学习工程师(一面17分钟 二面16分钟 都视频面offer)

一面:

自我介绍

项目介绍(。。。与上面差不多,就是没有问xgboost与GBDT区别)

你做过的项目中你比较熟悉什么算法,介绍下

开发方面接触多吗?看你会java

尬聊ing。。。

你有什么问题需要问我吗?(第一次回答,没有。。。)

总结:以为没有二面,但是过了4天接到了二面,二面在3天后。。。

二面:

自我介绍

项目介绍(。。。跟一面一样,不过问了好几个数据处理上的细节,有点专业,幸好我都懂,应付的过来)

RF的原理

还会其他的机器学习算法吗

我来介绍下我们部门的工作内容(balabala,说了5分钟。。。)

你有什么要问我的吗?(我心想,你都把我问题已经自己说完了,我有啥问题。。。)

那我接下来还有一个面试,就这样吧,具体的通知Hr会跟你联系。。。

总结:速战速决型。。。没想到就这样拿了一个提前批次offer

3、拼多多数据挖掘工程师(一面电话面 15分钟 gg)

自我介绍

项目介绍(一模一样的问题,问了几个核心的点,胸有成竹的答上来了)

RF原理,优化目标是什么!!!!!!(这个问题,我现在还没弄懂)

Kmeans聚类原理

朴素贝叶斯原理

决策树简介

了解推荐算法吗?给我介绍下这些算法怎么实现的?(懂是懂点。。。问题是没有做过相关的实现呀,懵逼ing)

算法题:如何层次遍历二叉树(据说用队列保存,遍历。。。没回答上来)

接着给我解释了下,然后就说今天的面试到此结束,再见!!!连让我问问题这个环节都没有了。。。gg

4、搜狗搜索事业部数据挖掘(一面二面+HR面 100分钟+40分钟 offer 已签)

一面+二面(面试我的直接就是主管,所以他说一面完,可以直接二面)

9点面试,8点半就到了,正好赶上主管去吃早饭,随口叫了我,正好我在,然后不吃饭拉我上去面试,真的很感动。大哥很和蔼,北方人。

进去后,直接说我先自我介绍下,然后就介绍了自己的部门,所做的事情,公司发展现状,这个岗位是干嘛的

自我介绍

项目介绍(互聊,感觉就是聊天的性质,很专业,每个点都问了一遍,四个项目,从背景到应用,聊到尴尬的地方就笑笑,对我工作两年的内容也很感兴趣,聊了很多工作内容,大概用了40分钟吧)

开始上技术了。。。

SVM的原理,推导,核函数的选举

调参的方法,方式

模型的选择原理

朴素贝叶斯可以做多分类吗?

RF原理

GBDT原理

对比两个的优缺点

过关了!!!我打了一个预防针,数据结构不怎么扎实,所以算法题给的没有牵扯到树,指针这类的。

算法题:一个矩阵,每一行,每一列数值都是递增的,寻找第k大的数

然后我就哗啦哗啦的写了一面的java代码,因为他说偏开发,最好以后多用java写,然后就给他秀了一波java。他说要看我代码风格。。。

接着问我框架懂不懂,多线程,异常抛出这些基础会不会。我说我就框架不会,其他的都学过,但是马上说了这个学起来不难,有算法的功底,很快就入手的。

回归到了机器学习,他问我python做数据挖掘没问题吧?我就实话实说了,numpy,pandas这些都用烂了,独立写一个算法从数据处理到模型建立都没问题,他就说其实不会数据结构也没啥,在数据处理和算法这块也用不上,效率不会在这优化。行吧,你还差一点点就能说服我,只要你说服了我,我就下去带你去见HR。。。

又来聊天了,聊当今互联网的发展,搜索的发展,反正就是侃。。。OK,走,见HR

总结:运气真好,碰到了一个这么和蔼的大哥,总之,感觉时间过得很快,很舒服的感觉。

HR面:

学历,职位,课程,参加了什么活动,班级排名

后不后悔考研只考了个211

对你影响最大的人是谁

工作期间内容是什么

期待薪资多少

有哪些offer

Ofo和摩拜,你更看好哪个

你有什么问题要问我的?

没了。。。等通知吧,9月底给答复

总结:反正就是聊天,也不知道筛不筛选,反正就是侃侃侃。

5、百度机器学习(一面 45分钟 gg)

自我介绍

算法题开始(我反问了句,要不要我们先聊聊项目,或者机器学习算法,面试官回了句,这是一面,面基础,面数据结构,二面才面算法)

第一题:一个堆,怎么按顺序改为一个双向链表(gg,根本不懂)

第二题:一个无序数组,用时间复杂最低的来寻找某两个数加起来等于一个固定的值m,输出这些对(完成的还行,就是申请空间过大)

面试到此结束。。。gg

6、苏宁云商算法工程师(面试 12分钟 offer)

自我介绍

项目介绍(里面问到了异常值处理,评价指标等)

挑选你最熟悉的算法介绍下

RF与决策树的对比(无语的问题。。。我反问了句,这就是父子的关系,会有啥对比的,估计他也意思到问错,所以马上换问题了)

RF与GBDT的区别(balabala,讲了7点,把他完全说服了,估计有些他都没听过)

现在手上有什么offer

班级排名多少

你还有什么问题?(老问题)

总结:这速度,还只有一面,简直了,预料到会过的,感觉他们得基础还没我好,嘿嘿,自恋一会,就这样拿到了第三个offer。

说到这里,也把我所有的面试全部说了一遍,可能因为个人能力加学校,很多好的公司都没给面试机会。所以我在这里建议学弟学妹们,在你们还有一年或者多年准备的时候,岗位也和我一样的话,我建议多搞几个竞赛,这样的话在简历筛选方面会更有优势。还有就是运气也是实力的一部分。

Offer选择,我也甚是纠结,既然做了决定,就这样吧。祝福还在校招的同学们,加油,一定会有自己心仪的公司的,祝福学弟学妹们,明年能更上一层楼!

作者:华仔17

本文来源于牛客网

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏AI科技大本营的专栏

特朗普“模仿”奥巴马?进阶版换脸技术DeepFakes来了

DeepFakes,这种能够移花接木的技术,它能将图像或视频中把一张脸替换成另一张脸。

1972
来自专栏机器学习之旅

写给想转行机器学习深度学习的同学

update 1:很多同学还是私信我,让我推荐或者提供一些电子书给他们,我这边也打包了一些我认为比较重要的,如果有需要的同学可以「邮箱」联系我。申明,我所发送的...

2884
来自专栏AI研习社

博客 | 一份中外结合的 Machine Learning 自学计划

看了Siraj Raval的3个月学习机器学习计划的视频,感觉非常好,地址:https://www.youtube.com/watch?v=Cr6VqTRO1v...

991
来自专栏互联网数据官iCDO

用数据讲故事的诀窍 ——创建有说服力图表的5个步骤

用数据说话是当今社会的一个特别流行的词,它反映了当今人类面对这个信息爆炸时代所需要做出的必然的改变。 有预测截至2020年,整个数字世界的数据量将达到44ZB,...

4139
来自专栏牛客网

从春招到秋招,算法工程师养成记(阿里+腾讯+其他)

自我介绍 大家好,我是老班长,一名老牛油(至于多老呢?我基本是第一批关注牛客网的同学,我加牛客网qq1群的时候,群里只有400多人(现在估计10多个群了吧),那...

63911
来自专栏AI研习社

读了这些书,才能正确入门深度学习

编者按:本文作者为 Jeffries Consulting 创始人 Daniel Jeffries,他以自己的阅读体验,对当前含金量极高的几本深度学习书籍进行点...

3006
来自专栏牛客网

算法工程师:双非渣硕是如何获得百度、京东双SP

本人本科硕士皆双非,和牛客大佬们没得比,目前拿到的还可以的offer就是百度SP和京东SP,都是做的推荐算法,其他的不说了。 先说一下个人经历吧,学校比较水,实...

8558
来自专栏人工智能头条

2015人工智能重大突破

1813
来自专栏牛客网

机器学习实习面经分享(蚂蚁金服,微信,美国亚马逊,完美)

完美和微信hr面完之后就给了口头offer,蚂蚁得再等几天 阿里,4场技术面+hr面 一面: 面试官说:聊一聊你的项目/paper吧 我:blabla说一通,问...

7557
来自专栏大数据挖掘DT机器学习

如何在业余时间学习数据分析?

我是一个web前端开发者和rails程序员,计算机专业出身,掌握Python、Ruby、C、Java编程语言,具有较为扎实的计算机理论基础。 现在工作之外的...

3247

扫码关注云+社区

领取腾讯云代金券