专栏首页AI研习社2020 年数据科学就业市场必备的五项技能

2020 年数据科学就业市场必备的五项技能

为 2020 年数据就业市场更新你的技能!

数据科学是一个竞争激烈的领域,人们正在迅速学习越来越多的技能和经验。这导致了机器学习工程师的从业要求的直线上升,因此 2020 年我的建议是,所有的数据科学家也需要成为开发人员。

为了保持竞争力,一定要为新工具带来的新工作方式做好准备!

1.敏捷开发


敏捷开发是一种组织工作的方法,已经被开发团队大量使用。越来越多的人扮演着数据科学家的角色,他们最初的技能是纯软件开发,这就产生了机器学习工程师这一角色。

Post-its 和敏捷开发似乎是并驾齐驱的

越来越多的数据科学家/机器学习工程师被划分为开发人员:他们的工作是不断改进现有的代码库中的机器学习相关的内容。

对于这类角色,数据科学家必须了解基于 Scrum 方法的敏捷工作方式。它为不同的人定义了不同的角色,这种角色定义保证了工作的顺利实施和持续改进。

2.Github


Git 和 Github 是面向开发人员的软件,在管理不同版本的软件时有很大帮助。它们跟踪对代码库所做的所有更改,此外,当多个开发人员同时对同一个项目进行更改时,它们能够真正让协作变得便利。

GitHub 是个不错的选择

随着数据科学家的角色变得越来越重要,能够熟练使用这些开发工具也是必备的技能之一。Git 正成为找工作时必备的一项技能,要熟练使用 Git 需要时间。当你一个人或者你的同事都是新手的时候,开始研究 Git 是很容易的,但是当你加入一个 Git 专家团队,只有你一个人是新手的时候,你可能会经历比你想象的多得多的努力才能跟上。

Git 是必须要掌握的技能

3.工业化


在数据科学领域,我们思考项目的方式也在发生变化。没有变的是,数据科学家仍然是用机器学习来回答商业问题的。但是,随着时间的发展,数据科学项目越来越多地是为生产系统开发的,例如作为大型软件中的微服务。

AWS 是最大的云供应商

与此同时,高级模型的 CPU 和 RAM 消耗也越来越大,尤其是在使用神经网络和深度学习时。

就数据科学家的工作而言,不仅要考虑模型的准确性,还要考虑项目的执行时间或其他工业化的方面,后者正变得越来越重要。

谷歌也有云服务,就像 Microsoft (Azure)一样

4.云与大数据


在机器学习产业化对数据科学家的约束越来越严重,同时,它也成为了数据工程师乃至整个 it 行业的严重约束。

一幅著名的漫画(来源:https://www.cyberciti.biz/humor/dad-what-are-clouds-made-of-in-it/ )

在数据科学家可以致力于减少模型所需时间的情况下,it 人员可以通过更改计算服务来做出贡献,这些服务通常通过以下一种或两种方式获得:

  • 云:将计算资源转移到外部供应商,如 AWS、Microsoft Azure 或 Google Cloud,可以很容易地建立一个可以快速从远程访问的机器学习环境。这就要求数据科学家对云功能有一个基本的了解,例如:使用远程服务器而不是自己的计算机,或者使用 Linux 而不是 Windows/Mac。

PySpark 正在为并行(大数据)系统编写 Python 代码

  • 大数据:它使用 Hadoop 和 Spark,这两个工具允许同时在许多计算机上并行处理任务(工作节点)。这要求数据科学家使用不同的方法来实现模型,因为代码必须允许并行执行。

5.NLP、神经网络与深度学习


目前,数据科学家仍然认为 NLP 和图像识别仅仅是数据科学的专业知识,并非所有人都必须掌握。

你需要理解深度学习:基于人脑思想的机器学习

但是,图像分类和 NLP 的用例越来越频繁,甚至在「常规」业务中也是如此。在目前的情况下,对这类技术没有基本的了解已经没办法适应当前的技术环境了。

即使你的工作中没有此类模型的直接应用程序,在实际操作的项目也很容易找到。这些项目可以让你理解图像和文本项目的基本步骤。

via:https://towardsdatascience.com/top-5-must-have-data-science-skills-for-2020-a5a53226b168/

本文分享自微信公众号 - AI研习社(okweiwu),作者:skura

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2019-12-27

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 如何避免数据科学领域的新手错误?

    原标题 | How to avoid rookie mistakes in the field of Data Science?

    AI研习社
  • 机器学习的本质就是数理统计?答案可能没这么简单

    可能许多刚刚接触 AI 的新人们都产生过类似这样的疑问:机器学习和数理统计,究竟有什么本质区别?不都是玩数据的么。 如果从传统意义上的数据分析师的观点来说,这个...

    AI研习社
  • 传统程序员要不要转行到AI?看完本文思路更清晰

    前言 近年来,随着 Google 的 AlphaGo 打败韩国围棋棋手李世乭之后,机器学习尤其是深度学习的热潮席卷了整个 IT 界。所有的互联网公司,尤其是...

    AI研习社
  • 2019Kaggle最新DS&ML报告:你大爷还是你大爷!

    近日,Kaggle发布了名为《2019Kaggle数据科学和机器学习概要》的报告。此报告为Kaggle对其社区的第三次年度调查,调查内容来自19717个Kagg...

    量化投资与机器学习微信公众号
  • 学了这么久,你知道Python机器学习全流程是怎样的么?

    万事开头难,首先Python机器学习整个流程的第一步就是学习Python这门编程语言的相关基础知识。

    小小科
  • 谷歌大脑小姐姐亲授:如何应聘成功羡煞旁人的AI工程师岗位

    不如听听过来人怎么说。最近,谷歌大脑的小姐姐Catherine Olsson上了一堂名企应聘公开分享,手把手教你应该以怎样的姿势开始AI安全类工程师求职之旅。

    量子位
  • AI Time|企业AutoML旨在流程自动化,可解释是人机交互的必经之路

    AI Time第一期的主题是“论道AI安全与伦理”,当时我们向在场的三位老师提出了一个困扰大众已久的问题,即“我们有一天真的会达到电影里的那种智能吗?拥有情感,...

    量子位
  • 谷歌教你学 AI -第一讲机器学习是什么?

    CDA字幕组 翻译整理 世界中充满了数据,大量的数据。图片、音乐、文字、电子表格还有视频。而且在短时间内丝毫没有放缓的趋势。机器学习给所有的数据带来意义。 A...

    CDA数据分析师
  • 你应该知道的机器学习方法

    用户1737318
  • Python机器学习工具&库,再也不怕找不到工具了

    用Python搞机器学习、数据科学,需要很多相关的资料,各种库、工具,都是常用、常找、常查的内容。

    一墨编程学习

扫码关注云+社区

领取腾讯云代金券