国外作者Jeff Hale浏览了一些求职网站,想找出哪些技能是数据科学家最需要掌握的技能,并对普通数据科学技能以及特定的语言和工具的特殊技能分别做了一些研究。
1
普通技能
以下是雇主最常搜索的数据科学家技能图表:
结果表明,分析和机器学习是数据科学家工作的核心。从数据中收集有用信息是数据科学的主要功能。机器学习的全部内容是创建系统来预测性能,这个需求非常大。
数据科学需要统计学和计算机科学技能。还需要能够交流见解并与他人密切合作。
2
技术技能
雇主们正在寻找的具备以下技能的数据科学家:
其中名列前20位的特定语言、库和技术工具如下:
1. Python
Python这种开源语言的受欢迎程度已广为所知。初学者容易接受,而且有很多支持资源。绝大多数新的数据科学工具都与它兼容。Python是数据科学家的主要语言。
2. R
R曾经是数据科学的主要语言,这种开源语言的根源在于统计学,它目前仍然很受统计学家的欢迎。Python或R对于几乎每一个数据科学家职位来说都是必须的。
3. SQL
SQL也很受欢迎。SQL是结构化查询语言,是与关系型数据库交互的主要方式。在数据科学领域,SQL有时会被忽视,但如果打算进入就业市场,这是一项值得展示的技能。
4. Hadoop和Spark
二者都是Apache提供的用于大数据的开源工具。Hadoop是一个开源的软件平台,用于分布式存储和分布式处理由商业硬件构建的计算机集群上的大型数据集。
Spark是一个快速、内存数据处理引擎,它具有优雅的、有表现力的开发API,使数据工作者能够高效地执行需要快速迭代访问数据集的流、机器学习或SQL工作负载。
5. Java和SAS
这两种语言的背后都有大公司支持,至少有一些免费产品。Java和SAS通常在数据科学社区中很少受到关注。
6. Tableau
这个分析平台和可视化工具功能强大,易于使用,并且越来越受欢迎。它有一个免费的公开版本,但如果想要保持数据私密性,则需要付费。
3
建议
1、证明你可以进行数据分析,并专注于成为真正擅长机器学习的人。
2、 投资于自己的沟通技巧,建议阅读《Made to Stick》这本书。
3、 掌握一个深度学习的框架。对深度学习框架的熟练程度是精通机器学习的重要组成部分。
4.、如果在学习Python和R之间进行选择,请选择Python。
加米谷大数据www.dtinone.com
领取专属 10元无门槛券
私享最新 技术干货