@all: 新浪 机器学习算法岗 面试实录

技术1面

1 Java水平怎么样?

2 问Python给自己打多少分?Python多线程怎么实现?

3 线程和进程的区别?

4 不同进程之间数据能共享吗?

5 Numpy和pandas做了什么?他们有什么优缺点?

6 五行五列二维数组,手写代码输出每行每列的最大值、最小值、平均值、方差

7 问Redis数据库知道多少?

Redis数据类型有几种?

MySQL和Redis有什么区别?

8 怎么设置缓存实现时间(怎么清缓存?)

9 Hadoop,spark用过吗?

10 举了一个高维数据,怎么找出异常值?

技术2面

二面面试官来了。是个算法大佬。是个专门做算法的。直接手出题,他说时间不多,就让我说思路。

1.先是一个m*n矩阵图走迷宫共有多少条路径?

需要用到动态规划,还有排列组合。

2. 2-sum问题。这个答出来了,中间有用了一种方法,自己想的,虽然没有降低时间复杂度,但挺新颖的。

3.问了最熟悉哪个机器学习算法。说逻辑回归,谈了下逻辑回归原理。问了为什么总Sigmod函数,而不是其他双曲函数或Rule函数。

4.然后他说对Xgboost这个感兴趣,Xgboost比GBDT做了什么优化,他说了一点,问还有一点是在数据集遍历上的优化?

5.问了随机森林,随机森林与决策树相比,有哪些更多的优化?

6.问了信息熵,和信息增益,和信息增益率,现实中代表什么?

信息增益率比信息增益解决了哪些问题?

总结

感受到大公司氛围就是挺好的。不管结果如何。都有所收获,至少知道了自己的优点和不足。

1. 缺乏常规算法训练

2. 没有很深究到机器学习原理的细节和底层具体推导。

想进大厂,必须得加强算法训练(多刷题),机器学习算法掌握来龙去脉,熟知重要原理和应用及优化。

以上面试问题,大家有自己的答案了吗?对自己拿不准的问题,欢迎大家留言,一起讨论。

相关链接

回归算法

回归分析简介

最小二乘法:背后的假设和原理(前篇)

最小二乘法原理(后):梯度下降求权重参数

线性回归:算法兑现为python代码

线性回归:OLS 无偏估计及相关性python分析

线性回归:谈谈多重共线性问题及相关算法

机器学习:说说L1和L2正则化

决策树回归:不调包源码实现

分类算法

逻辑回归| 原理解析及代码实现

逻辑回归| 算法兑现为python代码

决策树

对决策树剪枝

sklearn分类和回归

提炼出分类器算法

贝叶斯分类

朴素贝叶斯分类器:例子解释

朴素贝叶斯分类:拉普拉斯修正

单词拼写纠正器python实现

半朴素贝叶斯分类器

支持向量机参数求解

支持向量机之软间隔和核函数

聚类算法

期望最大算法:实例解析

高斯混合模型:聚类原理分析

高斯混合模型:聚类求解

高斯混合模型:求解完整代码

高斯混合模型:不调包多维数据聚类分析

K-Means算法

聚类算法之DBSCAN

集成算法

Adaboost算法

提升树算法思想

XGBoost思想

XGBoost模型构造

XGBoost 安装及实战应用

推荐算法

关联规则Apriori算法

PageRank算法原理

海量数据求top K 之最小堆实现

快速排序思想求topk

原文发布于微信公众号 - Python与机器学习算法频道(alg-channel)

原文发表时间:2018-04-07

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏人工智能

机器学习教程:最大熵文本分类器

在本教程中,我们将讨论最大熵文本分类器,也称为MaxEnt分类器。最大熵分类器是自然语言处理,语音和信息检索问题中常用的判别分类器。使用像JAVA...

98680
来自专栏IT派

PyTorch实例:用ResNet进行交通标志分类

【导读】本文是机器学习工程师Pavel Surmenok撰写的一篇技术博客,用Pytorch实现ResNet网络,并用德国交通标志识别基准数据集进行实验。文中分...

2.5K00

特征选择(Feature Selection)引言

您应该采纳哪种特征去创建一个可预测的模型呢?

46760
来自专栏AI研习社

Kaggle 比赛冠军经验分享:如何用 RNN 预测维基百科网络流量

最近在 Kaggle 上有一场关于网络流量预测的比赛(http://t.cn/RKRix7E)落下帷幕,作为领域里最具挑战性的问题之一,这场比赛得到了广泛关注。...

45660
来自专栏AI科技评论

学界 | 百度联合英伟达发布最新论文:使深度学习效率事半功倍的混合精度训练

AI科技评论消息: 在10月10日-11日在加拿大蒙特利尔召开的Rework Deep Learning Summit会议上,百度高级研究员Greg Diamo...

37780
来自专栏机器之心

CVPR2018 | CMU&谷歌Spotlight论文:超越卷积的视觉推理框架

选自arXiv 作者:陈鑫磊等 机器之心编译 参与:张倩、李泽南 人类在看到图像时可以进行合理的推理与预测,而目前的神经网络系统却还难以做到。近日,来自卡耐基梅...

36680
来自专栏月色的自留地

从锅炉工到AI专家(6)

15980
来自专栏专知

【干货】PyTorch实例:用ResNet进行交通标志分类

【导读】本文是机器学习工程师Pavel Surmenok撰写的一篇技术博客,用Pytorch实现ResNet网络,并用德国交通标志识别基准数据集进行实验。文中分...

99080
来自专栏AI研习社

用 TensorFlow 让你的机器人唱首原创给你听

AI 研习社按:这篇文章会用一个简单的模型在 TensorFlow 上来实现一个音频生成器,GitHub 代码链接详见文末“阅读原文”。原文作者杨熹,载于作者的...

35290
来自专栏机器之心

教程 | 从超参数到架构,一文简述模型优化策略

模型可以在训练过程中通过修正超参数而逐步建立。这在迁移学习中最为常见,在这种环境中,我们试图将现有模型的知识应用到新领域或新任务中。这是持续学习中更常见的问题,...

8930

扫码关注云+社区

领取腾讯云代金券