专栏首页数据派THU独家 | 5个步骤开启你的数据科学职业生涯!(附链接)

独家 | 5个步骤开启你的数据科学职业生涯!(附链接)

作者:Thomas

翻译:王雨桐

校对:丁楠雅

本文约2000字,建议阅读10分钟

本文为刚刚接触数据科学的新人,提出五个职场准备的建议。

数据科学已经成为21世纪最热门的工作领域,但如何才能成为数据科学家呢? 作为一名有抱负的数据科学家,或是准备从事数据科学工作的学生,你应该做好哪些准备? 需要什么技能?不要担心! 本文将会回答以上所有问题,并提供相关的资源链接,帮助你开启新的职业生涯!

数据科学是一个跨学科的领域,这意味着数据科学家要了解多个领域的知识,并成为不同领域的专家。 数据科学家必须在以下方面具备坚实的基础:

1. 计算机科学

2. 统计研究(需要扎实的基础)

3. 线性代数

4. 数据处理(数据分析的专业知识)

5. 机器学习

6. 软件工程

7. Python编程

8. R编程

9. 业务领域知识

为了成为一名高水平的数据科学家,下图是你需要掌握的一些知识领域:

除非你像激光束一样,将研究集中在这些领域,否则对上图中的一个或多个主题感到陌生是很正常的。 或者你了解两三个主题,但对其余主题了解甚少。 例如,你可能是一名计算机科学专业的学生,掌握数学知识但不了解统计研究分析所要求的高级统计知识。或者,你可能是一名有一些编程基础的统计学家。

有很多方法可以帮助你开启数据科学的职业生涯。 其中,你必须做的五件事是:

1. 向具有多年经验的前辈学习Python和R

2. 在GitHub上构建数据科学作品集

3. 加入Kaggle并参加数据科学竞赛

4. 练习面试问题

5. 做好基本的网络声誉管理,以提升形象

1. 向具有多年行业经验的前辈学习Python和R

行业经验是无可替代的。 比起一位热心的业余爱好者(如在线提供的许多课程),拥有5年以上数据科学行业工作经验的人将是讲师的不二人选。 学习Python和R是一方面,掌握Python和R是完全不同的事情。如果想在这个行业做得好,需要做到掌握技能,而不仅仅是具备基本能力。一定要确保你的讲师具有可靠的行业经验,因为这种经历会帮助你拿到顶尖的数据科学公司的offer。相比于拥有相关专业博士学位的学者,从拥有行业经验的专家那里会学到最多。

2. 在GitHub上构建数据科学作品集

在GitHub上拥有在线作品集(online portfolio)至关重要!

如果你不对学习的内容进行编程练习,也没有将课程应用于实际数据和现实情景,那么再好的培训都是无效的。你需要做数据科学项目,并且尽量使你的项目具有吸引力。

GitHub作品集应该遵循以下准则:

  • 使用目标公司正在使用的库,语言和工具。
  • 使用公司使用的数据集,最好是实际数据。(如果没有类似scikit-learn提供的学术数据集,可以使用Kaggle来获取练习数据集。)最好的选择是APIs编程构建的数据集,他们大多来自Twitter,Facebook,维基百科和类似的真实场景。
  • 选择具有市场价值的问题。不要选择学术项目,要尝试去解决现实的行业问题。
  • 在问题定义中要强调创造性和原创性,以及项目作品集所回答的问题。

3. 加入Kaggle并参加数据科学竞赛

Kaggle.com就是你的训练场。

如果你准备入手数据科学,立即成为Kaggler吧! 或者,如果你更倾向于开发,请加入TopCoder!(TopCoder也有数据科学发展路径)。 Kaggle是公认的数据科学的发源地,因为Kaggle多年来一直举办数据科学竞赛,并且是国际上所有顶尖数据科学竞赛的集合地。 收到知名公司offer的最简单方法之一就是在Kaggle上获得尽可能高的排名。 更重要的是,你可以将自己的表现与行业中的顶级竞争对手进行比较。

4. 练习面试问题

现在,很多网站都有数据科学岗位面试中使用的问题集。没有企业会让你死记硬背200个面试问题,但他们确实希望你能够在代码(最好是Python)或伪代码中解决基本的数据科学和算法问题。 最好还要了解基本概念,例如交叉验证是什么,维度的诅咒,过拟合的问题以及在实际场景中如何处理它。此外,你还需要能解释主要数据科学算法的内部细节,例如AdaBoost。 线性代数,统计学和一些基本的多变量微积分的知识也可以帮助你在竞争中抢占先机。

5. 管理你的网络声誉

这似乎与数据科学无关,但它是任何求职的基本要求。想想未来的雇主在看到求职者名姓名后的第一件事是什么?他会先百度这个名字。当搜索你的名字时,会出现什么内容?你的网络资料能否承受以下考验?

  • 在网络搜索时,你的名字是否有值得警惕的信号,如任何类型的负面报道或者争议?
  • 搜索姓名的条目是否能准确体现个人资料?
  • 你的Facebook,Twitter和Google个人资料是否有不恰当的内容?(例如私密照片)?
  • 可见的搜索结果能否准确地描述你的技能水平?

如果有以上这些潜在的问题,你可能需要调整自己的网络个人资料。你可以通过博客文章,成熟的网络评论,甚至为自己创建博客,向世界展现积极的自己。在如今的这个在线、数字、互联的世界,这对于求职者来说至关重要。

人才市场上待挑选的产品

在人才市场上,你试图将自己和你的网络信誉销售给从未见过你的人,他甚至没有听过你的名字。因此,互联网资料将成为关键,以确保你在竞争中抢占先机。目前许多培训网站提供的课程,讲师都是业余爱好者或具有不到2年行业经验的人士。所以,不要满足于低价课程,在互联网上,一分耕耘一分收获。如果这是你理想的职业领域,初期投资肯定会有更多的长期回报。

记得保持终身学习的态度。 机器学习和AI是以惊人速度发展的领域。订阅RSS源和在线资源,让你了解领域的最新发展,这是必须要做的事情。随时跟进最新的研究最能体现你的卓越追求,这些可以通过Feedly和Inoreader之类的阅读应用程序轻松完成。学习可能是你在大学里做的事情,但掌握是你一生所追求的目标,别轻易放弃。如果你可以按照文中提到的那样来完善自己,你一定可以获得自己理想的工作。最后,再次强调,一定要特别注意在GitHub上的数据科学作品集,可以帮助你在竞争中脱颖而出!

原文标题: 5 Steps to Prepare for a Data Science Job 原文链接: https://dimensionless.in/5-steps-to-prepare-for-a-data-science-job/

译者简介

王雨桐,UIUC统计学在读硕士,本科统计专业,目前专注于Coding技能的提升。理论到应用的转换中,敬畏数据,持续进化。

本文分享自微信公众号 - 数据派THU(DatapiTHU)

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2018-12-18

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 自然语言处理数据集免费资源开放(附学习资料)

    作者:Jason Brownlee 翻译:梁傅淇 本文长度为1500字,建议阅读3分钟 本文提供了七个不同分类的自然语言处理小型标准数据集的下载链接,对于有志于...

    数据派THU
  • 谷歌与CMU联合发文:审视数据对深度学习的重要性(附论文)

    来源:机器人圈 作者:Chen Sun、Abhinav Shrivastava、Saurabh Singh、Abhinav Gupta 本文长度为1800字,建...

    数据派THU
  • 独家 | 一文盘点AutoML 库(附PPT等链接)

    Jeff Dean在ICML 2019上进行了有关AutoML的演讲,并将自动化分为4个级别:

    数据派THU
  • 数据科学家自我修养——一份数据科学的开放课程清单

    最近一年以来,大数据这个概念被吹嘘的天花乱坠,仿佛你要是不说大数据就落伍了。继云计算之后,大数据已然成为IT行业的热点。《哈佛商业评论》更是宣称“数据科学家”是...

    小莹莹
  • 【陆勤践行】数据科学家自我修养——一份数据科学的开放课程清单

    数据科学家自我修养——一份数据科学的开放课程清单 最近一年以来,大数据这个概念被吹嘘的天花乱坠,仿佛你要是不说大数据就落伍了。继云计算之后,大数据已然成为IT行...

    陆勤_数据人网
  • 【翻译】数据科学的多语言协作编程方式:Python + R + SQL

    在这篇文章中,我将试图使用一种新的方法来介绍数据科学编程。 R vs. Python question中集中谈论了数据科学编程的问题,每个人都...

    小莹莹
  • Lnmp yum 安装脚本 (for CentOS)

    心情大好,给VPS升级了一下系统,然后自己配了LNMP安装脚本,用yum源安装的话更新比较方便点哈 ​​这个过程挺麻烦啊,所以果断要记下来,以防以后要用到 ...

    owent
  • R语言和 Python —— 一个错误的分裂

    最近有一些文章提出与年龄相关的问题:“崭露头角的年轻数据科学家们是学习R语言还是Python更好?” 答案似乎都是“视情况而定”,在现实中没有必要在R和Pyt...

    小莹莹
  • 【书籍】数据科学经典书籍

    数据问题需要数据科学来解决! 什么是数据科学?没有一个统一的定义。简而言之,数据科学就是研究和解决数据问题。 不管你是数据挖掘工程师,还是数据分析师,还是算法工...

    陆勤_数据人网
  • 干货 | 14张高清Python数据科学家(数据分析&机器学习)代码速查表

    来源 | https://www.jianshu.com/u/be48b04ecc3e

    用户2769421

扫码关注云+社区

领取腾讯云代金券