[待更新]
秋招快结束了,本想写点多家公司的面经记录一下,但是大都记不清了,只有百度的面试过程还记的清楚,希望能够帮助到今年的同学或者以后的学弟学妹。总的来说,百度面试时间很长,节奏紧凑,考察全面,也比较深入,面试官很nice,全程以一种相互讨论的态度。三轮技术面试一共四小时。
霸面:
百度支持霸面,但是需要满足三个条件:1.在笔试通过的面试者全部面完 2.面试官有空的情况下 3.简历优秀。这里建议到中午11点多的时候别急着去吃饭,因为这时候最可能有面试机会。我从早上9点多开始等,等到中午11点半左右,由于早上的面试者都已经提前面完了,所以我们霸面的同学就拿到了机会。
一面:
1.自我介绍,最满意项目
2.了解优化算法吗?sgd和牛顿法的区别,3.拟牛顿法和牛顿法的关系,拟牛顿法解决了牛顿法哪个问题?推导下牛顿法。牛顿法在什么时候只需要迭代一次就能求解,什么时候牛顿法不能适用?
4.正则化方法?l1与l2的区别,为什么可以克服过拟合?l1正则假设的参数分布是什么
5.梯度消失问题的解决方案?batch normalization为什么能够提升训练速度?
6.场景题:需要根据用户的query来设计一个广告投放系统,怎么设计,具体到模型设计细节。输入query要能输出广告的一个rank。中间涉及pairwise版模型的设计,以及sentence embedding的设计细节。
7.编程题:给定一个数组,求最大的连续子序列和,O(n)时间与O(1)空间
二面:
1.自我介绍与项目
2.面向对象特性,分别做一个解释
3.python的异常机制
4.linux进程通信的办法
5.tcp和udp的区别
6.有两个很大的文件,均无法放入内存。其中存放着很多整数,如何找到两个文件中的相同整数
7.编程:有一个坐标轴,上面有很多点,每个点有坐标,求长度为L的绳子最多能够覆盖几个点。
8.bagging和boosting的区别,深入讲解boosting,讲了下gbdt,让推导详解
9.l1和l2
10讲一下优化算法,推导了自适应优化算法和带动量的梯度下降
9.场景题:在电商或游戏行业有许多优质用户,如何利用百度的数据帮他们找出其他的优质用户,需要在各个行业有通用性,假设其他行业的用户与百度的用户id是有一对一映射的。说到采样负样本(优质用户id作为正样本)并进行模型训练的方法,开始问如何解决多次训练耗时较长,并且需要预测几亿用户耗时的问题。
三面:
1.讨论了实习项目与研究生项目
聚类算法了解哪些
2.设计题:给定(用户id,时间,经度,纬度)四元祖,设计方案识别用户家和公司的位置。这题个人觉得是很好的面试设计题,我的方法是密度聚类定地点位置,时间段活跃特征+是否工作日训练分类模型识别家/公司的方法。
3.分词问题有哪些解决办法?词典,crf还说了lstm,问lstm怎么做分词
4.介绍了团队,百度文化
补充项目相关涉及到的问题范围,问的细节记不太清了:gbdt+lr,cnn,lstm,attention,项目中深度学习模型如何克服过拟合,linear blending等模型融合方法,label propogation algorithm, spark,时间序列相似度索引等
作者:gg_zero
本文来源于牛客网