专栏首页加米谷大数据数据科学家的必备技能有哪些?

数据科学家的必备技能有哪些?

国外作者Jeff Hale浏览了一些求职网站,想找出哪些技能是数据科学家最需要掌握的技能,并对普通数据科学技能以及特定的语言和工具的特殊技能分别做了一些研究。

1

普通技能

以下是雇主最常搜索的数据科学家技能图表:

结果表明,分析和机器学习是数据科学家工作的核心。从数据中收集有用信息是数据科学的主要功能。机器学习的全部内容是创建系统来预测性能,这个需求非常大。

数据科学需要统计学和计算机科学技能。还需要能够交流见解并与他人密切合作。

2

技术技能

雇主们正在寻找的具备以下技能的数据科学家:

其中名列前20位的特定语言、库和技术工具如下:

1. Python

Python这种开源语言的受欢迎程度已广为所知。初学者容易接受,而且有很多支持资源。绝大多数新的数据科学工具都与它兼容。Python是数据科学家的主要语言。

2. R

R曾经是数据科学的主要语言,这种开源语言的根源在于统计学,它目前仍然很受统计学家的欢迎。Python或R对于几乎每一个数据科学家职位来说都是必须的。

3. SQL

SQL也很受欢迎。SQL是结构化查询语言,是与关系型数据库交互的主要方式。在数据科学领域,SQL有时会被忽视,但如果打算进入就业市场,这是一项值得展示的技能。

4. Hadoop和Spark

二者都是Apache提供的用于大数据的开源工具。Hadoop是一个开源的软件平台,用于分布式存储和分布式处理由商业硬件构建的计算机集群上的大型数据集。

Spark是一个快速、内存数据处理引擎,它具有优雅的、有表现力的开发API,使数据工作者能够高效地执行需要快速迭代访问数据集的流、机器学习或SQL工作负载。

5. Java和SAS

这两种语言的背后都有大公司支持,至少有一些免费产品。Java和SAS通常在数据科学社区中很少受到关注。

6. Tableau

这个分析平台和可视化工具功能强大,易于使用,并且越来越受欢迎。它有一个免费的公开版本,但如果想要保持数据私密性,则需要付费。

3

建议

1、证明你可以进行数据分析,并专注于成为真正擅长机器学习的人。

2、 投资于自己的沟通技巧。我建议阅读《Made to Stick》这本书。

3、 掌握一个深度学习的框架。对深度学习框架的熟练程度是精通机器学习的重要组成部分。

4.、如果在学习Python和R之间进行选择,请选择Python。

本文分享自微信公众号 - 加米谷大数据(DtinoneBD)

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2019-02-22

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • AI系统实现了自动编程,程序员要被取代了吗?

    随着人工智能技术的快速进展,人工智能时代的序幕已经揭起,目前深度学习在图像处理方面的能力已经接近于人,甚至在某些方面已经超过人的识别能力。在语音识别、自然语言处...

    疯狂的技术宅
  • 数据预处理-对类别数据的处理方法

    参数: -indices: A Tensor of indices. -depth: A scalar defining the depth of the ...

    caoqi95
  • AI Challenger 2018:细粒度用户评论情感分类冠军思路总结

    2018年8月-12月,由美团点评、创新工场、搜狗、美图联合主办的“AI Challenger 2018全球AI挑战赛”历经三个多月的激烈角逐,冠军团队从来自全...

    美团技术团队
  • Python库简单说明(持续更新...)

    目前,网上已有成千上万个Python包,但几乎没有人能够全部知道它们。单单 PyPi上就有超过47000个包列表。

    周小董
  • 用机器学习加速你的网站

    我一生中大约73%的时间都在思考网络性能:如何在慢速手机上能播放60FPS的画面,用完美的顺序加载资源,通过离线缓存能做的一切。等等等等。

    疯狂的技术宅
  • 第十章 神经网络参数的反向传播算法

    假设神经网络的训练样本有m个,每个包含一组输入x和一组输出信号y; L表示神经网络总层数;(? L = 4) S_I表示每层的neuron个数(S_l表示输...

    tomas家的小拨浪鼓
  • 深度学习在美团配送ETA预估中的探索与实践

    美美导读:ETA(预计送达时间预估)是配送调度环节中非常重要的一环,而且涉及的因素特别多。本文阐述了ETA深度学习技术迭代中的一些尝试及效果。

    美团技术团队
  • [机器学习]python3构建决策树

    判定树是一个类似于流程图的树结构:其中,每个内部结点表示在一个属性上的测试,每个分支代表一个属性输出,而每个树叶结点代表类或类分布。树的最顶层是根结点。

    周小董
  • TensorFlow练习3: RNN, Recurrent Neural Networks

    前文《使用Python实现神经网络》和《TensorFlow练习1: 对评论进行分类》都是简单的Feed-forward Neural Networks(FNN...

    周小董
  • 根因分析初探:一种报警聚类算法在业务系统的落地实施

    美美导读:系统报警是运维人员每天必须要面对的事情,本文分析了后端服务运维中大量报警出现时相互淹没的问题,选定了一种基于聚类的根因分析算法,并且针对业务报警日志进...

    美团技术团队

扫码关注云+社区

领取腾讯云代金券