机器学习实习生面试总结(阿里 腾讯等)

今年来一直在找暑期实习,现在基本已经确定了,前后历经差不多2个月吧,发现了很多自己的缺点,同时也希望写出来供需要的人参考了解

先说下我自己的情况吧,决定去腾讯TEG的机器学习岗实习了,面试期间(3月初-4月底)投了不少公司的暑期实习(都是机器学习岗),大概有这么多吧(按照投的时间顺序):

  • 完美世界(笔试挂)
  • 美团(offer)
  • 阿里蚂蚁金服(offer)
  • 腾讯TEG(offer)
  • 滴滴研究院(offer)
  • 去哪儿(offer)
  • 360(笔试挂)
  • 商汤科技(一面挂)
  • 华为(offer)
  • 网易有道(笔试通过,面试要去北京我没去)

百度没投,它时间很晚(4月底笔试,5月初面试),然后我就没投了

每家的情况都说下吧: (1) 完美世界笔试挂,投的太早完全没复习果然gg了 (2) 美团内推没有笔试(非官网投递),不过实验室的其它人都没获得面试机会(看脸??),一面就直接过了(做机器学习图像的),面试官还是很nice的,直接发offer了 (3) 阿里就很坑了,3面技术面+HR面(更优秀的还有交叉面),然而我并没有,三面面的不好,问了我一堆java源码的,我没答上来,到现在我还没有拿到offer,一直是面试中,估计也没什么戏,时间真的持续了好久;有意思的是,一面的面试官说今年ML岗太火,他们倾向于博士。。。。也是醉了 (4) 腾讯现场面的,两面+HR面,每一面都刷很多人,一面去的时候人山人海,二面就很少人了,HR面去的时候只有我一个,我差点以为我走错片场了。。。结果过了,TEG网络部的机器学习岗 (5) 滴滴研究院,也是非官网投的,两面+HR,问的比较深,感觉滴滴研究院这帮做算法的水平很不错,之后顺利通过,大数据策略组的机器学习实习生 (6) 去哪儿也是现场面的,一个下午就面完直接口头发的offer,效率很高,两面+HR,一面是个小弟面的基础,二面HR后来告诉我是数据组的老大面的项目,顺利过了 (7) 360不知道怎么回事,笔试做的感觉还可以,3个编程题AC了两个然后也没过,听说招实习很少 (8) 商汤科技也是内推的,过了笔试,一面是香港打来的,问的非常深,只问deep learning,其它不问,面了50分钟吧,gg了 (8) 华为暂时还没面,因为我拿了华为编程比赛的奖,所以免了笔试,不过笔试也不难 (9) 网易有道投的是java开发,听说笔试挂了无数人,然而我没挂,后来让去北京总部去面,报销路费,我决定再三还是没去,放弃了,因为实习不想去java开发(那么为什么我当时投java开发???)

其实还有微软,不过那编程题实在是做不出来,ACM编程题,有兴趣的去感受下hihoder微软2017预科生,另外告诉一点,即使是PM也是要做这个题的。。。

给我的感触还是很多,总结如下:

(1) 早准备,我就是去年冬天在外地出差干活没复习,今年来做笔试的时候就很吃亏 (2) 好好刷leetcode,基本在线面试的笔试题都是leetcode的题 (3) 实习经验非常重要,有实习做过相关项目的话很加分 (4) 了解的广不如了解的深,最好要在某个领域钻研的比较有心得(比如推荐,用户画像,目标检测等),因为面试官会顺着你的简历一直往下问,比如你做了用户画像,他就会问你怎么做的?如何做的特征工程?特征如何选择?balabala… (5) 想去阿里的一定要java玩的溜,尤其源代码, jvm,集合框架这是一定会问的 (6) 虽然说搞ML的集中在算法方面,但是最好还是要会Hadoop,Spark之类的,毕竟你算法需要数据,数据只能你自己去拉(滴滴和阿里面试官原话) (7)ML竞争很激烈,做好心理准备

5月6号更新: (1)阿里的蚂蚁金服offer已经拿到 (2)分享面试的具体问题

  • 什么是boosting tree
  • GBDT
  • L1和L2正则为何可以减弱over-fitting?
  • L1和L2正则有什么区别
  • KNN和LR有什么本质区别
  • 怎么理解Dropout
  • 为什么random forest具有特征选择的功能
  • random forest有哪些重要的参数?
  • DNN为什么功能强大,说说你的理解
  • SVM的损失函数是什么?怎么理解
  • 介绍下Maxout
  • 项目中over-fitting了,你怎么办
  • 详细说一个你知道的优化算法(Adam等)
  • 项目(比赛)怎么做的模型的ensemble
  • stacking是什么?需要注意哪些问题
  • 了解哪些online learning的算法
  • 如何解决样本不均衡的问题
  • fasterRCNN中的ROIPooling是如何实现的
  • 如何进行特征的选择
  • 如何进行模型的选择
  • 什么是梯度消失?怎么解决
  • 常用的有哪些损失函数
  • XX用户画像挖掘怎么做的feature engineering?
  • 假设一个5*5的filter与图像卷积,如何降低计算量?
  • 做过模型压缩吗?介绍下
  • 什么是residual learning?说说你的理解
  • residual learning所说的residual和GBDT中的residual有什么区别?
  • FFM和FTRL有过了解吗?
  • 你对现在Deep Learning的发展和遇到的问题有什么看法?

基本这些就是我问的问题,不是一家公司,其它的问题还有,主要看你的简历和项目,这个每个人不一样

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏Linyb极客之路

“大话架构”阿里架构师分享的Java程序员需要突破的技术要点

源码分析是一种临界知识,掌握了这种临界知识,能不变应万变,源码分析对于很多人来说很枯燥,生涩难懂。

671
来自专栏Java架构师进阶

Java程序员从阿里、百度面试回来,这些面试题你们会吗?

百度面了两次,分别是百度糯米和金融事业部,百度目前只有这两个部门的招聘岗位和我比较匹配。面试都在西二旗的百度新总部,园区还在施工,离地铁也比较远,需要打车过去。

551
来自专栏一名叫大蕉的程序员

靠谱的数据开发从业指南No.82

数据开发太庞大了 有小伙伴让我聊聊数据开发的职业规划和从业指南,因为数据开发从业人员的知识量实在是太太太大了,今天恰好这个机会好好聊聊。 我们先来看看 Inf...

18210
来自专栏腾讯数据中心

数据中心未来供电技术发展浅析(下)

三、现有12V的市电直供应用情况: 3.1Google的12V分布式UPS Google的12V挂电池方案以分布式电源加分布式电池作为掉电备份。它的每个服务器带...

34513
来自专栏腾讯数据中心

腾讯数据中心供电系统节能最佳实践

背景 随着互联网的快速发展,数据中心的规模及能耗也越来越大,目前全球数据中心的能耗已经超过了能源使用量的1.3%,我国数据中心的能耗预计2015年将相当于三峡电...

2904
来自专栏一名叫大蕉的程序员

靠谱的数据开发从业指南No.82

有小伙伴让我聊聊数据开发的职业规划和从业指南,因为数据开发从业人员的知识量实在是太太太大了,今天恰好这个机会好好聊聊。

1986
来自专栏灯塔大数据

干货|6个公司的大数据岗位的面试经验

本人住在有人间天堂之称的城市,6年多开发经验,最近2年主要在做大数据相关的开发,最近考虑换工作,基本也只考虑大数据相关岗位。目前新工作已经找好,但想分享一下最...

3115
来自专栏企鹅号快讯

让你轻松学习嵌入式的几种线路图方向

嵌入式学习是一个循序渐进的过程,如果是希望向嵌入式软件方向发展的话,目前最常见的是嵌入式Linux方向,关注这个方向,我认为大概分3个阶段: 1、嵌入式lin...

1806
来自专栏ThoughtWorks

#TWer 好读书 读好书# 美丽的架构

美丽的架构 文/张逸 美丽的架构究竟是怎样的?架构师们上下求索,孜孜以求,始终不得其解。归根结底,美丽这个词语总还是偏于感性认识,就仿佛音乐之美,绘画之美,不能...

2585
来自专栏xingoo, 一个梦想做发明家的程序员

《一线架构师实践指南》—— 读后总结

之前总觉得架构是一件很高大上的工作,跟普通的编码设计不太一样。前一段实践,自己也尝试做过架构的工作,可惜经验不足导致架构非常混乱。这里读完这本书,大体上对架构...

22410

扫码关注云+社区