说好的面经来啦!! 数据挖掘/大数据开发

活着就意味必须要做点什么,请好好努力。——村上春树

之前找实习还有秋招的时候看了不少大神的帖子,现在也来回馈一下~ 感觉这方面帖子也不多。

重点:以下均为个人理解感受,也不全面,有失偏颇的欢迎各位大大来补充纠正~~

一、关于岗位

数据挖掘,大数据开发这两个岗位其实有点微妙,不同公司甚至同一公司不同小组的理解也不太一样,有的把数据挖掘归到算法了,也有的根本没有数据挖掘这个岗位。所以,划重点,具体公司具体分析!

个人的一点理解:大数据开发偏底层架构,技术包括hadoop, spark, hive, SQL, kafka,java …… 数据挖掘偏策略算法,但是肯定不是专做算法的,包括hadoop ,spark ,一点机器学习,Python …

但是注意!! 数据挖掘实际上接触机器学习的不多,毕竟公司有专业的算法岗,所以基本还都是偏底层了…

二、自己的技术情况

找实习的时候是想往大数据开发方向找,当时技术栈是hadoop ,java,hbase 等,但是歪打正着进了一个算法组,实习岗位是算法岗(所以有的公司算法也会做一些大数据的业务,毕竟算法建立在数据上,数据哪里来… 有的公司自己写任务抽取清洗… 有的公司别的岗位包办…),做的东西是spark,Python ,机器学习… 接触了一点深度学习的皮毛,但是水平肯定不够去面试纯算法,而且hive,SQL之类的都没有接触到,所以后期找工作也比较尴尬,基本上如果有数据挖掘的岗位就投这个,没有就投大数据开发。

三、一些公司的面经

总体来说有实习经历就好很多,基本都会问项目,hadoop 和spark 肯定都会问,这些都是基础了,语言方面我是java为主,所以还会有java的东西,包括多线程虚拟机之类的。

因为本人比较佛系,所以面试完也都没有什么记录,所以具体手撕代码写了什么之类的就不写了,主要写一下各个公司的岗位还有技术,写的比较简略了见谅……

我就写面试通过的公司了,按照面试的顺序来说~ 薪资什么的就不提了哈~ 遗憾的是一个BAT都木有……… 但还是很满意了~(佛系一点…)

1.快手:

大数据开发。3轮技术1轮HR。

标准的大数据开发岗位,一面问了hadoop,Java 基础,hive (这个我直接说没接触过),二面问了Java 基础比较多,虚拟机线程池之类的,三面一直在聊hadoop 的底层,源码之类的。

感受:标准大数据开发岗,无算法涉及

2.美团:

数据挖掘算法。3轮技术1轮HR。

美团把数据挖掘和算法放在一起了,应该也有单独的大数据岗。一面狂问Java ,以至于我都怀疑我是不是投成了后台开发… 二面主要是项目,问的非常具体,还有一点spark 。三面基本没问什么。

感受:标准的数据挖掘,不涉及数据仓储,会有机器学习的问题,总体感觉只有美团这个岗位比较符合我的技术栈………诶心塞塞

3.头条:

大数据开发。3轮技术1轮HR

一面java,计算机网络,项目,hadoop ,hive 。二面spark ,项目,这里spark 问的比较细,比如参数设置调优之类的… 尽力说了,以为会挂在这儿…。三面hadoop ,项目。

感受:最后三面的时候有跟面试官沟通,说自己没接触过数仓的东西,会点机器学习,有没有数据挖掘相关的组。回答说没问题,进公司之后会按照个人技术进行划分… 然而offer并没有体现啊哭唧唧… 进了一个纯纯的大数据开发组,不过也可以理解,宇宙条从来不缺算法何况我这种半路出家的哈哈哈

4.京东:

大数据开发。最后offer岗位为数据挖掘。2轮技术1轮HR。

一面项目,spark ,hive,机器学习。二面纯java…当时快要面崩溃了,问的非常底层,甚至到指令级别优化之类的。

感受:京东数据挖掘是算在算法了,但是也多方打听了一下,很多做数据分析,大数据开发的都被归到数据挖掘了,进组之后做纯大数据开发的可能性更高。

5.网易:

大数据开发。2轮技术1轮HR

面的比较晚了,本来不抱什么希望去的,结果感觉问的比较水?一面项目,hadoop ,数仓,spark 。二面因为到中午吃饭时间了,问的比较仓促,项目,java。

感受:纯大数据开发,不涉及算法。

————————————————————

总得来说,还是偏纯大数据开发的更多,所以想做数据挖掘的小伙伴注意了,不要期望可以在这个岗位中涉及到很多算法之类的,因为都有专做机器学习的大大们在~

算是回馈牛客,也是对自己的一个总结,欢迎大家继续补充纠正~

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏日常学python

用数据分析来看哪种 Python 程序员最赚钱?

本文以Python爬虫、数据分析、后端、数据挖掘、全栈开发、运维开发、高级开发工程师、大数据、机器学习、架构师这10个岗位,从拉勾网上爬取了相应的职位信息和任职...

45840
来自专栏日常学python

同学利用Python爬虫制作王者荣耀出装助手,引来了隔壁班的女生!

暑假回家,”小皇帝”般的生活持续了几天,头几天还挺舒服,闲久了顿时觉得好没意思。眼看着10天的假期就要结束,曾信誓旦旦地说要回家学习,可拿回家的两本书至今一页未...

21220
来自专栏华章科技

灵魂画手一图解读:成为数据分析师的必备能力项

上周末晚上,我的学妹突然约我出来喝咖啡,我觉得这件事情不简单,果然一到她就递给我手机,开口就问:

15440
来自专栏CSDN技术头条

征战 BAT 算法面试

对于机器学习的初学者来说,面试方面的经验总结也非常重要。能够加深对算法和机器学习基本理论的理解。所以,本文网罗了多年来 BAT 的面试真题,能搞懂这些面试题加上...

16810
来自专栏张叔叔讲互联网

当妈妈在淘宝购物的时候,都发生了什么?(下篇)

在上一篇文章中,讲到了你的妈妈成功从你手中夺得了电脑的控制权,然后打开了淘宝网并且在网站首页搜索框中搜索了“美丽的裙子”,之后用一种挑剔的眼光盯着电脑屏幕一个多...

16440
来自专栏北京马哥教育

Python爬虫爬取知乎小结

最近学习了一点网络爬虫,并实现了使用Python来爬取知乎的一些功能,这里做一个小的总结。网络爬虫是指通过一定的规则自动的从网上抓取一些信息的程序或脚本。我们知...

39140
来自专栏新智元

华为大转型!AI战略重磅发布,两颗AI芯片问世,算力超谷歌英伟达!

10月10日,上海世博馆,华为全联接大会,华为副董事长、轮值董事长徐直军重磅发布了华为的AI战略和全栈解决方案,总结一句话:云管端各层面发力AI。

9920
来自专栏IT大咖说

“第五届中国国际大数据大会”将聚焦大数据创新应用

一份简单的外卖,如何在骑手人员调配、天气变化、出菜速度等因素实时变动的情况下,可以及时送到消费者手里?

11720
来自专栏镁客网

接地气儿的人工智能,如何“开源赋能,智慧共享”

早在2015年7月国务院发布的《关于积极推进“互联网+”行动的指导意见》中就提出,促进人工智能在智能家居、智能终端、智能汽车、机器人等领域的推广应用,到2017...

10730
来自专栏自然语言处理

K-means聚类算法研究

统计数据分析的一门技术,在许多领域受到广泛应用,包括机器学习,数据挖掘,模式识别,图像分析以及生物信息。聚类是把相似的对象通过静态分类的方法分成不同的组别或者更...

20830

扫码关注云+社区

领取腾讯云代金券

年度创作总结 领取年终奖励