前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >【干货】数据科学家的理想简历长啥样?手把手教你!

【干货】数据科学家的理想简历长啥样?手把手教你!

作者头像
量化投资与机器学习微信公众号
发布2019-02-26 16:38:32
7030
发布2019-02-26 16:38:32
举报
文章被收录于专栏:量化投资与机器学习

本期作者:George Liu

本期翻译:1+1=6

Python和R之间不再争论

因为Python现在是主导者

曾经有人争论过Python或R是否是数据科学的首选语言。显然,市场需求告诉我们Python现在是领导者。同样值得注意的是,R比SAS更少提及。因此,如果你正在考虑进入数据科学领域,请考虑将你的学习重点放在Python上。 SQL作为数据库的语言是数据科学家第二重要的语言。由于数据科学家职业的广泛性,其他语言也扮演着重要角色。

总之,数据科学家的主要语言是:Python,SQL,Scala,Lua,Java,SAS,R,C ++和Matlab

机器学习工程师所需的语言更加多样化

Python作为机器学习工程师的顶级语言并不令人惊讶。由于需要从头开始实现算法并在大数据环境中部署ML模型,因此C ++和Scala等相关语言也很重要。总的来说,与其他两个角色相比,语言的需求似乎更加分散。

总之,机器学习工程师的主要语言是:Python,Scala,Java,C ++,Lua,SQL,Javascript,Matlab,CSS和C#

如果你想成为一名数据工程师

SQL是必须掌握的

数据工程师一直处理数据库,SQL是数据库语言,所以难怪SQL是很热的语言。 Python很重要,但仍然失去了Scala和Java,因为这些语言可以帮助数据工程师处理大数据。

总之,数据工程师的主要语言是:SQL,Scala,Java,Python和Lua。

Scala是数据科学中第二大语言(不是R)

当我们检查不同的角色时,有趣的是,Scala可以是第二个或第三个。所以我们可以说数据科学中的前三种语言是PythonSQLScala如果你正在考虑学习一门新语言,请考虑使用Scala!

Spark是除数据工程师之外首选大数据技能

仅对于数据工程师而言,Hadoop比Spark更多,但总的来说,Spark绝对是首先应该学习的大数据框架。 Cassandra对工程师而言比科学家更重要,而Storm似乎只与数据工程师有关。

总之,数据科学的顶级大数据技术是Spark,Hadoop,Kafka,Hive

TensorFlow是深度学习的王者

数据工程师职位发布中几乎没有提到深度学习框架,因此该角色似乎不需要DL框架。 DL框架的最多提及来自机器学习工程师角色表明ML工程师确实很多地处理机器学习建模,而不仅仅是模型部署。 此外,TensorFlow在深度学习领域绝对占据主导地位。 尽管Keras作为高级深度学习框架在数据科学家中非常受欢迎,但它几乎与机器学习工程师角色无关,可能表明ML从业者大多使用较低级别的框架,如TensorFlow。

总之,数据科学中最重要的深度学习框架是TensorFlow,Torch,CaffeeMXNet

AWS全面支配

计算机视觉是机器学习中大部分需求的来源

对于一般的数据科学家来说,自然语言处理是最大的ML应用领域,其次是计算机视觉,语音识别,欺诈检测和推荐系统。 有趣的是,对于机器学习工程师来说,最大的需求来自计算机视觉,而自然语言处理则是远程第二。 另一方面,数据工程师再次成为专注的专家 - 这些ML应用领域中没有一个与他们相关。

洞察力 - 如果您想成为数据科学家,你可以选择构建各种类型的项目,以根据您想要进入的领域展示您的专业知识,但对于机器学习工程师来说,计算机视觉是最佳选择!

可视化,Tableau是必须的

可视化工具主要是数据科学家所需要的,很少有人提到数据工程师和机器学习工程师。 但是,Tableau是所有角色的首选。 对于数据科学家来说Shiny,Matplotlib,ggplotSeaborn似乎同样重要。

Git对每个人都很重要

而Docker仅适用于工程师

接下来,我们使用词云来探索每个角色最常用的关键词,并结合相应的技能为所有数据科学角色构建理想的配置文件!

数据科学家更多是关于机器学习

而不是业务或分析

Data Scientist一直被视为需要统计,分析,机器学习和商业知识的全方位专业。 似乎仍然如此,或者至少,数据科学家仍然存在各种需求。 然而,现在看来,数据科学家们更多地关注机器学习而不是其他任何东西。

其他主要要求包括:业务,管理,通信,研究,开发,分析,产品,技术,统计,算法,模型,客户/客户和计算机科学。

机器学习工程师是关于研究

系统设计和建筑

与一般的数据科学家相比,机器学习工程师肯定似乎有一个更集中的组合,包括研究,设计和工程。 显然,解决方案,产品,软件和系统是主导的主题。 伴随着这些,有研究,算法,AI,深度学习和计算机视觉。 有趣的是,商业,管理,客户和沟通等术语似乎也很重要。 这可以在该项目的进一步迭代中进一步研究。 另一方面,管道和平台也脱颖而出,证实了机器学习工程师在构建数据管道以部署ML系统方面的责任的共识。

数据工程师是真正的专家

与机器学习工程师相比,数据工程师拥有更加专注的产品组合。 显然,重点是通过设计和开发管道来支持产品,系统和解决方案。 最高要求包括技术技能,数据库,构建,测试,环境和质量。 机器学习也很重要,可能是因为管道主要用于支持ML模型部署数据需求。

我希望这个项目可以帮助您了解雇主正在寻找什么,最重要的是帮助您做出有关如何定制简历和学习哪些技术的明智决策!

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2018-12-07,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 量化投资与机器学习 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
NLP 服务
NLP 服务(Natural Language Process,NLP)深度整合了腾讯内部的 NLP 技术,提供多项智能文本处理和文本生成能力,包括词法分析、相似词召回、词相似度、句子相似度、文本润色、句子纠错、文本补全、句子生成等。满足各行业的文本智能需求。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档