前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >[缘分]霸面,四小时,百度算法offer

[缘分]霸面,四小时,百度算法offer

作者头像
牛客网
发布2018-04-28 14:27:02
1.1K0
发布2018-04-28 14:27:02
举报
文章被收录于专栏:牛客网牛客网

[待更新]

秋招快结束了,本想写点多家公司的面经记录一下,但是大都记不清了,只有百度的面试过程还记的清楚,希望能够帮助到今年的同学或者以后的学弟学妹。总的来说,百度面试时间很长,节奏紧凑,考察全面,也比较深入,面试官很nice,全程以一种相互讨论的态度。三轮技术面试一共四小时。

霸面:

百度支持霸面,但是需要满足三个条件:1.在笔试通过的面试者全部面完 2.面试官有空的情况下 3.简历优秀。这里建议到中午11点多的时候别急着去吃饭,因为这时候最可能有面试机会。我从早上9点多开始等,等到中午11点半左右,由于早上的面试者都已经提前面完了,所以我们霸面的同学就拿到了机会。

一面:

1.自我介绍,最满意项目

2.了解优化算法吗?sgd和牛顿法的区别,3.拟牛顿法和牛顿法的关系,拟牛顿法解决了牛顿法哪个问题?推导下牛顿法。牛顿法在什么时候只需要迭代一次就能求解,什么时候牛顿法不能适用?

4.正则化方法?l1与l2的区别,为什么可以克服过拟合?l1正则假设的参数分布是什么

5.梯度消失问题的解决方案?batch normalization为什么能够提升训练速度?

6.场景题:需要根据用户的query来设计一个广告投放系统,怎么设计,具体到模型设计细节。输入query要能输出广告的一个rank。中间涉及pairwise版模型的设计,以及sentence embedding的设计细节。

7.编程题:给定一个数组,求最大的连续子序列和,O(n)时间与O(1)空间

二面:

1.自我介绍与项目

2.面向对象特性,分别做一个解释

3.python的异常机制

4.linux进程通信的办法

5.tcp和udp的区别

6.有两个很大的文件,均无法放入内存。其中存放着很多整数,如何找到两个文件中的相同整数

7.编程:有一个坐标轴,上面有很多点,每个点有坐标,求长度为L的绳子最多能够覆盖几个点。

8.bagging和boosting的区别,深入讲解boosting,讲了下gbdt,让推导详解

9.l1和l2

10讲一下优化算法,推导了自适应优化算法和带动量的梯度下降

9.场景题:在电商或游戏行业有许多优质用户,如何利用百度的数据帮他们找出其他的优质用户,需要在各个行业有通用性,假设其他行业的用户与百度的用户id是有一对一映射的。说到采样负样本(优质用户id作为正样本)并进行模型训练的方法,开始问如何解决多次训练耗时较长,并且需要预测几亿用户耗时的问题。

三面:

1.讨论了实习项目与研究生项目

聚类算法了解哪些

2.设计题:给定(用户id,时间,经度,纬度)四元祖,设计方案识别用户家和公司的位置。这题个人觉得是很好的面试设计题,我的方法是密度聚类定地点位置,时间段活跃特征+是否工作日训练分类模型识别家/公司的方法。

3.分词问题有哪些解决办法?词典,crf还说了lstm,问lstm怎么做分词

4.介绍了团队,百度文化

补充项目相关涉及到的问题范围,问的细节记不太清了:gbdt+lr,cnn,lstm,attention,项目中深度学习模型如何克服过拟合,linear blending等模型融合方法,label propogation algorithm, spark,时间序列相似度索引等

作者:gg_zero

本文来源于牛客网

本文参与 腾讯云自媒体分享计划,分享自作者个人站点/博客。
原始发表:2018.02.25 ,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档