[缘分]霸面,四小时,百度算法offer

[待更新]

秋招快结束了,本想写点多家公司的面经记录一下,但是大都记不清了,只有百度的面试过程还记的清楚,希望能够帮助到今年的同学或者以后的学弟学妹。总的来说,百度面试时间很长,节奏紧凑,考察全面,也比较深入,面试官很nice,全程以一种相互讨论的态度。三轮技术面试一共四小时。

霸面:

百度支持霸面,但是需要满足三个条件:1.在笔试通过的面试者全部面完 2.面试官有空的情况下 3.简历优秀。这里建议到中午11点多的时候别急着去吃饭,因为这时候最可能有面试机会。我从早上9点多开始等,等到中午11点半左右,由于早上的面试者都已经提前面完了,所以我们霸面的同学就拿到了机会。

一面:

1.自我介绍,最满意项目

2.了解优化算法吗?sgd和牛顿法的区别,3.拟牛顿法和牛顿法的关系,拟牛顿法解决了牛顿法哪个问题?推导下牛顿法。牛顿法在什么时候只需要迭代一次就能求解,什么时候牛顿法不能适用?

4.正则化方法?l1与l2的区别,为什么可以克服过拟合?l1正则假设的参数分布是什么

5.梯度消失问题的解决方案?batch normalization为什么能够提升训练速度?

6.场景题:需要根据用户的query来设计一个广告投放系统,怎么设计,具体到模型设计细节。输入query要能输出广告的一个rank。中间涉及pairwise版模型的设计,以及sentence embedding的设计细节。

7.编程题:给定一个数组,求最大的连续子序列和,O(n)时间与O(1)空间

二面:

1.自我介绍与项目

2.面向对象特性,分别做一个解释

3.python的异常机制

4.linux进程通信的办法

5.tcp和udp的区别

6.有两个很大的文件,均无法放入内存。其中存放着很多整数,如何找到两个文件中的相同整数

7.编程:有一个坐标轴,上面有很多点,每个点有坐标,求长度为L的绳子最多能够覆盖几个点。

8.bagging和boosting的区别,深入讲解boosting,讲了下gbdt,让推导详解

9.l1和l2

10讲一下优化算法,推导了自适应优化算法和带动量的梯度下降

9.场景题:在电商或游戏行业有许多优质用户,如何利用百度的数据帮他们找出其他的优质用户,需要在各个行业有通用性,假设其他行业的用户与百度的用户id是有一对一映射的。说到采样负样本(优质用户id作为正样本)并进行模型训练的方法,开始问如何解决多次训练耗时较长,并且需要预测几亿用户耗时的问题。

三面:

1.讨论了实习项目与研究生项目

聚类算法了解哪些

2.设计题:给定(用户id,时间,经度,纬度)四元祖,设计方案识别用户家和公司的位置。这题个人觉得是很好的面试设计题,我的方法是密度聚类定地点位置,时间段活跃特征+是否工作日训练分类模型识别家/公司的方法。

3.分词问题有哪些解决办法?词典,crf还说了lstm,问lstm怎么做分词

4.介绍了团队,百度文化

补充项目相关涉及到的问题范围,问的细节记不太清了:gbdt+lr,cnn,lstm,attention,项目中深度学习模型如何克服过拟合,linear blending等模型融合方法,label propogation algorithm, spark,时间序列相似度索引等

作者:gg_zero

本文来源于牛客网

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏小小挖掘机

推荐系统遇上深度学习(二十五)--当知识图谱遇上个性化推荐

之前在美团听过关于知识图谱和个性化推荐的一个讲座,接下来的几篇,我们将围绕讲座中提到的知识点,来介绍下知识图谱是如何同个性化推荐相结合的!本篇算是一个开篇吧,希...

2281
来自专栏机器之心

斯坦福李纪为博士毕业论文:让机器像人一样交流

39611
来自专栏量子位

牛津大学最新研究:给我一张照片,就能让你开口讲话

若朴 发自 凹非寺 量子位 报道 | 公众号 QbitAI 这句话你说过没有?不承认?我给你看证据! 于是你就看到一段视频,画面中的你开口说了一段你不曾讲过的话...

4267
来自专栏人人都是极客

如何加速深度学习?GPU、FPGA还是专用芯片

计算机发展到今天,已经大大改变了我们的生活,我们已经进入了智能化的时代。但要是想实现影视作品中那样充分互动的人工智能与人机互动系统,就不得不提到深度学习。

931
来自专栏CSDN技术头条

深度学习 vs 概率图模型 vs 逻辑学

【编者按】在上个月发表博客文章《深度学习vs机器学习vs模式识别》之后,CMU博士、MIT博士后及vision.ai联合创始人Tomasz Malisiewi...

1977
来自专栏PPV课数据科学社区

数据挖掘与生活:算法分类和应用

“如何分辨出垃圾邮件”、“如何判断一笔交易是否属于欺诈”、“如何判断红酒的品质和档次”、“扫描王是如何做到文字识别的”、“如何判断佚名的著作是否出自某位名家之手...

4794
来自专栏企鹅号快讯

第一篇:模仿游戏

有一部科幻电影叫《超体》,主题是人类一直以来的一个传说,“人类目前只开发了大脑10%的潜能。如果大脑潜能被进一步开发,那么人类将拥有更强的能力。”具体有哪些能力...

2056
来自专栏专知

【专知特邀】KDD2018 | 浙江大学和帝国理工大学最新工作(附代码和数据集)

【导读】专知内容小组特邀KDD2018交通速度预测工作第一作者为大家分享最新工作。交通速度预测容易受到各种因素的影响且缺少一个大型的包含各种信息的公开数据集。最...

2257
来自专栏数据科学与人工智能

【数据可视化】读图时代可视化及其技术分析

一、可视化的涵义 1、可视化的由来 “可视化”一词源于英文“Visualization”,译为“形象化”、“成就展现”等。事实上,将任何抽象的事物、过程变成图形...

2808
来自专栏牛客网

顺丰提前批人工智能岗技术面面经

【每日一语】人们常常会欺骗你,是为了让你明白,有时候,你唯一应该相信的人就是你自己。——《千与千寻》人们常常会欺骗你,是为了让你明白,有时候,你唯一应该相信的人...

861

扫码关注云+社区

领取腾讯云代金券