AI时代就业指南 | 如何入门数据分析&数据挖掘?

1.

数据分析和数据挖掘联系和区别

联系:都是搞数据的

区别:数据分析偏统计,可视化,出报表和报告,需要较强的表达能力。数据挖掘偏算法,重模型,需要很深的代码功底,要码代码,很多= =。

2.

怎么入门

请百度“如何成为一名数据分析师”或者“如何成为一名数据挖掘工程师”。英文好上Quora,不行上知乎,看看入门资料。

3.

选哪些书

看入门资料给你提供的书,有电子版下电子版,没电子版买纸质书,花不了多少钱。

4.

用什么语言

数据分析:excel是必须,R是基本,python是进阶。SAS和Matlab给土豪去玩吧。

数据挖掘:python是必须,java/c/c++是基础,hadoop/mapreduce/spark先掌握一点,因为并不是所有公司都有这么大的数据量。

5.

需要学数学吗

都需要

数据分析:统计学,概率论,

数据挖掘:高数/数学分析,数值分析,线性代数,凸优化,运筹学(这些是基本)数字信号处理,模式识别,矩阵论(进阶)

6.

要不要读研究生

一般来说,只有应届生去找工作会比较看重学历,因为你没有其他可以展示你能力的。但是随着工作时间久了(两年+),你的能力远超于你所在的学校,学历就不重要了。如果要读,建议读计算数学/概率论/模式识别/计算机 方面的研究生,争取发论文(高质量),否则应聘的时候并没有什么影响,当然,有些公司可能会在初筛的时候根据学历筛选人,正常,真想进就多工作几年再社招进去呗,学历不好也不能怪别人对不对。

工作几年后,如果觉得到瓶颈了,可以再去读书,没什么,这个时候可能你更清楚自己需要的是什么。

7.

选择去哪个公司

大公司核心职位优先>>中型公司核心职位>大公司边缘职位>优秀的创业小公司核心职位>中型公司边缘职位>坑人的创业小公司边缘职位

原因:

1.大公司数据量多,人才多。能接触到核心项目核心职位是最佳选择。(BAT,网易有道,微软等)

2.中型公司发展快,机会多,压力大,成长快。(美团滴滴58)

3.创业公司慎选,如果有创业公司的offer,一看他们差不差钱,而看他们项目赢不赢利,三看团队技术氛围浓不浓。不差钱+盈利但技术氛围不浓,可以去,但不适合对技术追求高的人;不差钱+技术氛围浓但暂时不盈利,可以考虑,但要搞清楚盈利模式。盈利+技术氛围浓但现在差钱,可以考虑,争取成为核心成员,一旦融资不得了。如果差钱又不盈利技术氛围还差,算了吧,耗不起。

实在不知道怎么选,就看两点:1.数据量大小 2.技术氛围。钱少可以以后赚,技术氛围浓最重要。

8.

怎么面试

1.诚实 2.真诚 3.展现你的潜力

9.

没有项目经验怎么办

应届生要啥项目经验,本科生就说说自己的毕业论文,数模/ACM/阿里的参赛经历或获奖经历,以及可能会有的实习经历。研究生就说实验室的项目,负责的工作,完成的成果和发表的论文。不要夸大,如实说。

10.

到底该选数据分析还是数据挖掘

代码能力强直接搞算法,弱就先做数据分析,慢慢来,不着急。想我毕业的时候只会Matlab,后来被领导逼着两星期学了R,一个月学了python,自己在业余学了java,hadoop和spark等,也是一步步来的,不要想一口吃成个大胖子。

11.

前途怎么样

我从实习到现在年薪翻了5倍,你说怎样。你要是只冲着钱去呢,去做销售吧;要是喜欢纯数呢,去做研究吧;要是喜欢从数据里发现一些有趣的事情并应用上去,那就来做数据分析/数据挖掘吧。

12.

一天的工作大概是怎样的

到公司,跑数据,看结果,调优,跑数据,看结果,看论文,改代码,调优,跑数据,看结果。。。

13.

有没有推荐的网站

google(之前被墙了,某个晚上恢复了,马上要回归了,现在不能用的话买个vpn吧,mac本推荐shadowsocks软件)

stack overflow:改bug神器

github:开源大法好!

Quaro:资料搜集地/经验借鉴处

(以及各类招聘网站:我不想学习的时候就看这个,看和自己理想的工作还有多少差距,打鸡血。。)

14.

有没有推荐的IDE

sublime text+secureCRE/iterm够用了(mac本,windows的话就下个notepad++和linux就可以了)

各种语言的IDE都可以下一个,调试用。没有推荐,哪个顺手用哪个。

15.

用什么电脑

有钱直接上服务器,没钱买个配置高的,实在没钱买个能敲的就行。以后工作有钱了再整个好的。

16.

怎么投简历

校招有网申,我没有搞过校招,不太清楚流程。如果错过校招,最好去拉勾周伯通等垂直网站投。不太推荐58/赶集/智联,这些招聘网站上的职位类型主流偏低端,碰到不靠谱的公司概率较大。

17.

怎么看岗位要求知道我的工作内容

一个简单的方法:所有数据分析类的岗位要求里写的要求会excel,PPT等的干的都是统计员的活!所有数据分析类的岗位要求里写的要求会GA,pu,uv分析的都是运营部门的!所有数据挖掘岗位里写的要求只有hadoop,spark,ETL的干的都是数据仓库的活!其他的自己看吧,数据挖掘有好几种职位:广告ctr预估的,机器学习的,推荐系统,自然语言处理等等。自己选择吧。反正入门都可以尝试做做。

总之,入门容易深入难,数学不好可以学,但会制约你的发展,代码不好也可以,但也会制约你的职业生涯,所以那些说“我觉得我数学不好代码能力也不强觉得R好难英语也不好看不懂国外的网站学多了会不会掉头发会不会找不到男/女朋友blahblah”的,你开心就好,你的职业生涯掌握在自己手中。

最后,感谢当初把我带入门的彭爱民老师,高芹老师和李海雄老师等等,好想回去看你们啊!!!!!!!

以上是工作半年以来想到的所有新入行的人可能会问的问题,以及我自己踩过的坑的一些总结,不全面,也没什么调理,大家将就看吧。除了以上问题有什么的再问我吧,上班时间不要问哦~(虽然下班也没什么时间,逗玩猫看看书刷刷手机就睡觉了 = =)。

不要觉得我厉害,我觉得我到现在都是入门级,周围同事搞深度学习码代码码的飞起快被虐惨了,我是渣渣 = =

拜拜~学弟学妹们加油~

出处:http://www.cnblogs.com/charlotte77/

原文发布于微信公众号 - PPV课数据科学社区(ppvke123)

原文发表时间:2017-08-12

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏智能算法

一文看懂大数据思维

真正的革命并不在于分析数据的机器,而在于数据本身和我们如何运用数据。将大规模的数据与运用融合一起,将会颠覆很多我们原来的思维。大数据思维原理到底是什么?笔者概括...

46350
来自专栏java一日一条

做博士还是做一个专业的程序员?

当我从大学毕业获得计算机科学学位的时候,我就想继续学习并获得博士学位。但是,我又想作为一个软件开发者去参与工作,所以我在这一行中工作了五年之后,又回去念了一年的...

9910
来自专栏DT数据侠

他可能是中国最极客的营销专家 | 数据科学50人·王炼

如今,我们每个人都在谈论“数据科学”。哈佛商业评论杂志甚至将数据科学家定义为“21世纪最性感的职业”。在这个大数据时代,究竟什么是数据科学?数据科学家又究竟是...

15700
来自专栏灯塔大数据

大数据行业人士必知10大数据思维原理

大数据思维原理是什么?简单概括为10项原理,当样本数量足够大时,你会发现其实每个人都是一模一样的。 一 数据核心原理 从“流程”核心转变为“数据”核心 大数据...

43150
来自专栏数据的力量

大数据思维的十大原理:当样本数量足够大时,你会发现每个人都是一模一样的

64660
来自专栏数据猿

投稿丨透过VR行业研究:分析火热概念下的VR发展现状!

【友盟+】发布了【VR类应用行业研究报告】从火热概念下的行业现状下对VR类应用发展规模及用户行为趋势、VR类应用用户属性等方面进行了分析。 截止至第二季度底,根...

28170
来自专栏数据科学与人工智能

【数据科学】大数据思维的十大原理:当样本数量足够大时,你会发现每个人都是一模一样的

大数据思维原理是什么?笔者概括为10项原理。 一、数据核心原理 从“流程”核心转变为“数据”核心 大数据时代,计算模式也发生了转变,从“流程”核心转变为“数据”...

31970
来自专栏大数据挖掘DT机器学习

做数据挖掘工作需要具备哪些思维原理?

大数据思维原理是什么?笔者概括为10项原理。 一、数据核心原理 从“流程”核心转变为“数据”核心 大数据时代,计算模式也发生了转变,从“流程”核心转变为“数据...

36990
来自专栏钱塘大数据

【周末漫谈】大数据思维的十大核心原理

一、数据核心原理 从“流程”核心转变为“数据”核心 大数据时代,计算模式也发生了转变,从“流程”核心转变为“数据”核心。Hadoop体系的分布式计算框架已经是...

37490
来自专栏量子位

英伟达新开源GPU加速平台:主打数据科学和机器学习,50倍于CPU

因为这个名为RAPIDS的开源GPU加速平台出现,固有的数据工作,看起来将迎来变革。

9730

扫码关注云+社区

领取腾讯云代金券