数据科学家、数据分析师、数据挖掘工程师、数据工程师,你分的清楚吗?

数据科学家(Data scientist)的叫法来自国外,广义上它是对从事数据分析和数据挖掘从业人员的一个泛称,它只是一个头衔,并不是一个职位。狭义上,数据科学家一般是指行业里面的领军人物和顶尖科学人才,如百度前首席数据科学家吴恩达。

在人才市场上我们通常可以看到的是后三个职位(数据分析师、数据挖掘工程师、数据工程师),接下里我们就区分一下这几个职位的相同点和不同点。首先看下企业对这三个职位的要求和描述。

职位和能力 下面是阿里对这3个职位的要求和描述:

数据分析师 岗位描述: 1、独立负责业务数据收集整理,搭建业务数据体系,结合业务对多种数据源进行深度诊断性组合分析、挖掘、深度分析; 2、通过专题分析,对业务问题进行深入分析,为业务的策略、产品优化提供数据支持; 3、独立完成业务日常的产品运营工作,可以快速有效地取得一定的业务成果。 岗位要求: 1、统计、数学、信息技术、生物统计等专业本科及以上学历(硕士优先),二年以上相关工作经历; 2、熟悉数据库基本原理,熟练运用SQL,熟练操作excel、PPT;熟悉数据挖掘的基本原理,熟练操作SAS、SPSS clementine等数据分析/挖掘工具的优先; 3、良好的数据敏感度,能从海量数据提炼核心结果,熟练独立编写商业数据分析报告,及时发现和分析其中隐含的变化和问题,给出建议; 4、具备良好的沟通能力和团队精神,较强的学习能力,能承担一定的工作压力

数据挖掘工程师 岗位描述: 在这里,你可以学习和掌握阿里巴巴集团业界最先进的大数据处理平台,涉及信息检索、自然语言处理、机器学习、数据挖掘、分布式计算等一系列的专业领域; 在这里,你将拥有最好的数据和实验环境,立足于uc浏览器数亿用户和数千亿浏览信息,与这些领域内的顶尖大牛工程师们一起参与目前最前沿的推荐、预测等大数据应用场景的算法设计和工程实现。 岗位要求: 1、本科以上学历,扎实的统计学、数据挖掘、机器学习理论基础,能够利用高等数学知识推演高维数学模型。 2、熟悉聚类、分类、回归、图模型等机器学习算法,对常见的核心算法理解透彻,有实际建模经验; 3、具有扎实的计算机操作系统、数据结构等编程基础,精通至少一门编程语言例如c++/python/R; 4、深入理解Map-Reduce模型,对Hadoop、Spark、Storm等大规模数据存储与运算平台有实践经验; 5、对于推荐系统和广告系统有实践经验者优先; 6、能够积极创新, 乐于面对挑战, 负责敬业; 7、优秀的团队合作精神;诚实, 勤奋, 严谨。

数据开发工程师 岗位描述: 1. 参与阿里大数据开发平台建设,构建开放、安全、标准的阿里对外数据开发平台体系 2. 基于阿里海量数据的数据仓库建设和数据分析,同时针对各业务场景探索大数据解决方案 3. 在公共云计算环境构筑数据交换、融合、分享的生态,让数据驱动业务 岗位要求: 1. 计算机或相关专业本科及以上学历 2. 具有丰富的数据开发经验,对数据处理、数据建模、数据分析等有深刻认识和实战经验 3. 熟悉SQL,有一定的SQL性能优化经验 4. 熟练掌握Java语言,MapReduce编程,脚本语言Shell/Python/Perl之一 5. 业务理解力强,对数据、新技术敏感,对云计算、大数据技术充满热情 6. 积极乐观、诚信、有责任心;具备强烈的进取心、求知欲及团队合作精神

可以简单概括一下这三个职位的特点:

数据分析师 业务线,负责通过数据分析手段发现和分析业务问题,为决策作支持。 数据挖掘工程师

偏技术线,负责通过建立模型、算法、预测等提供一些通用的解决方案,当然也有针对某业务的。 数据工程师

技术线,负责搭建仓库搭建、数据的存储、处理、计算处理、报表开发等。

从能力上看,可以认为:

从关系上看,数据分析师和数据挖掘工程师一般是可以相互替代的,在很多公司里,对这两个职位也是不加以区分的

下图是国外对这几个职位的能力栈描述。图中蓝色圈为普通工程师能力栈,粉色圈为数据开发工程师能力栈,绿色圈为数据科学家能力栈。需要说明的是,国外并没有数据挖掘工程师这一说法,国内的数据挖掘工程师的能力栈和本图中绿色圈相当,而数据分析师的能力栈则正好和不于粉丝圈交叉的纯绿色区域相当。

定位和价值

正如我之前的《三三制:大数据企业如何打造一支打不烂、打不散的团队?》一文所述,上述这三个职位在大数据团队里分别是开发者、构建者和分析者的角色。他们是大数据团队里最核心的成员,这三个角色组合起来,可以覆盖大部分企业大数据项目需求。

在PPV课社区里经常有人会比较这几个职位,问题也是五花八门,随便拎几个出来大家感受一下:

针对上述问题在此我谈一下看法。首先,不同职位在不同行业、不同公司、不同阶段的贡献是不一样的。如同部队打仗一样,企业需要的也是团队配合,多部门协同作战,每个职位都有其独特价值,没有什么可比性。这就如同你比较一个公司的销售和研发人员谁价值更大一样,不实际也没有任何意义。

其次,大多数情况下,薪酬(指平均薪酬)只代表一个人在职场的价格,不代表他在公司的价值。找工作除了看薪酬也要看是否合适自己,职场中拼的都是相对优势,你要想获取高收入,应该扬长避短,寻找可以发挥自己优点的行业和职位,而不是寻找什么最有价值的工作。

目前市场上数据挖掘工程师的平均工资的确是要高于数据分析师的,原因是数据挖掘工程师写代码比较多,写代码越多,工资越高,这个在任何一个国家、任何一个行当都是如此,不代表数据挖掘工程师的价值更大(参见《2016年数据科学薪酬大盘点》一文)。

下图是国外这几个职位的薪酬对比:

数据来源:Datacamp

可以看出在国外薪资待遇排序是: 顶尖数据科学家 > 数据架构师 >数据工程师 >数据分析师。在国内,数据挖掘工程师的薪酬是略高于数据工程师的,其他排序和上图相同。

在此,PPV课也给出几个职位之间的晋升通道供大家参考:

手边书推荐

最后针对不同职位推荐几本手边书给大家,如果你对上述职位感兴趣,欢迎加入PPV课数据科学社区,和我们一起向着数据科学的梦想不断探索和前行!

数据挖掘工程师:

机器学习工程师:

数据分析师:

数据开发工程师:

原文发布于微信公众号 - PPV课数据科学社区(ppvke123)

原文发表时间:2017-05-19

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏人工智能头条

数据科学家、机器学习工程师与普通的软件工程师有什么不同

1473
来自专栏大数据文摘

大咖 | “大数据之父”达文波特:成功的数据科学家不一定要有研究生学位

1453
来自专栏机器之心

业界 | 这家积累9年的老牌技术供应商,打算如何做嵌入式AI?

机器之心原创 作者:虞喵喵 「今年是嵌入式 AI 的起步阶段,真正的市场会从 2019 年开始慢慢扩大。」 在中科创达产品总监兼创思远达 CEO 杨宇看来,随着...

3496
来自专栏WeTest质量开放平台团队的专栏

游戏人工智能 读书笔记(一)前言与介绍

自人工智能诞生之始,就和游戏紧密的相结合在一起。因为人们通常认为,人类玩游戏的过程是蕴含着人类的智能的。因此,当人们创造出一个能够完成人类的某种游戏的程序,我们...

1064
来自专栏AI科技评论

专访腾讯钟黎:知文团队在智能问答系统方面的探索

对于刚刚成立的腾讯知文团队来说,过去是收获颇丰的一年。虽然成立尚不足一年,但这一团队已在 AAAI、IJCAI、SIGIR、EMNLP、COLING 等顶会上发...

1941
来自专栏养码场

爬取某招聘网站、近2万+程序员的工资单,得到以下5点涨薪结论!

某一技术人爬了某招聘网站,获取近一周的程序员工资18275条。其中,有工资的17628条(北京4892,上海5073,广州3386,深圳4277)。本文分别从工...

611
来自专栏达摩兵的技术空间

面试之你该为老板选什么样的人

本来的话,是觉得自己不够资历写这样的文章,不过总有一个过程嘛,自己也曾经作为技术面试官面试过一部分人,有一些自己的观点,可能会给还在面试或者面试官一些有益的启示...

671
来自专栏新智元

微软前副总裁:机器学习和人工智能5大关键 | 黑箱不黑

【新智元导读】微软前副总裁S. Somasegar从智能应用开发的角度,总结了2016机器学习和人工智能的5大发展趋势:算法和数据结合的微智能,将能灵活地在应用...

3369
来自专栏前沿科技

中兴视觉大数据报道:人工智能代表了信息技术的未来

中兴之智能视觉大数据报道:预测未来最好的方式是去创造未来。今天与其我们来预测未来的技术,不如根据我们今天已经开始的创新,来谈谈未来的技术。套一句时髦的话,叫作未...

1895
来自专栏腾讯研究院的专栏

大数据带来的四种思维

近年来大数据技术的快速发展深刻改变了我们的生活、工作和思维方式。大数据研究专家舍恩伯格指出,大数据时代,人们对待数据的思维方式会发生如下三个变化:第一,人们处...

2079

扫码关注云+社区

领取腾讯云代金券