毕业后想当数据科学家?做好这7件事可以受益终身

全文共1303字,预计学习时长3分钟

对于大数据行业来说,数据科学家无疑是整个产业的核心。如果正在埋头苦学的你想得到这份工作,就需要学习并掌握这份工作需要的技巧,并把这些技巧在简历中展示出来。

扎实的统计学和数学基础

在数据科学驱动的技术公司中,统计技能至关重要。你应该了解统计学术语和基本概念,例如测试、分布、似然估计、四分位数范围等。

同时,数学知识也有助于改善表达,可以让你能够展示结果之间的显著差异。执行这些计算需要多元微积分或线性代数的基本知识,这有利于你构建特定的方法来解决特定的问题。

强大的编程基础与灵活的算法逻辑

为了追求成为数据科学家的梦想,你需要非常擅长编程,并且能够在给定的任意时间内对代码进行分析、理解和编写。要达到这个目标,必须对不同的编程语言进行积极的学习与实践。

对于数据科学从业者来说,R语言往往是首选的编程语言,因为它是专门为数据科学设计的。实际上,超过40%的数据科学家选择用R语言解决统计问题。不过,R语言的学习曲线是很长的,如果你不擅长编程的话,往往非常困难。

另一方面,在众多面向对象的语言中,Python是数据科学中最常见的首选编程语言之一。Python的适应性很强,在Python中几乎能够完成数据科学的所有步骤。Python中可以导入不同格式的数据,你可以轻松地把SQL表格导入到工作区间中。同时,它也支持在工作环境内部创建数据集。这就是为什么51%的数据科学家首选Python作为编程工具。

分享的热情

当你走出自己的小圈子,才能够更好地认识自己。人们需要有健康的竞争精神,才能够更好地发展。如今,有很多竞赛、黑客马拉松、研讨会可以满足数据科学爱好者。参加这些活动可以扩大知识面,还能够了解该领域当前的发展趋势。

比如说,Machinehack(https://www.machinehack.com/),Hackerearth(https://www.hackerearth.com/sprints/l/field/hackathons-data-science-and-engineering/)和NMIMS(https://badmchampionship.nmims.edu/)就是很好的数据科学平台。

项目经验很重要

学习只是开始,真知来自实践。

一个人的才华只有在实际工作中才能够被充分欣赏。要勇于参加实践项目,尝试了解项目的背景和解决问题的框架。目前数据科学对实践经验非常看重,大公司都在寻找具有经验和分析思维的从业者。

处理非结构化数据

非结构化数据是指无法转化为数据库表格的内容,比如视频、帖子、博客、用户评论和音频等。由于它们的结构很模糊,因此很难对这些数据进行分类。

能够处理非结构化数据是数据科学家一项非常重要的技能。Apache Hadoop,Microsoft HDI insight,NoSQL,Polybase,presto等等都是需要掌握的一些软件,可以帮助你处理非结构化数据。

用数据来讲故事

吸引决策者的眼球,让他们通情达理地理解你的工作,是一项数据科学家必备的技能。

公司中产生的大量数据需要用大众可以理解的方式表达出来。与简单的数据相比,人们更加容易接受图形化的表示。所以作为数据科学家,你需要借助可视化工具(如ggplot,d3.js,matplotlib和Tableau)来对原始数据进行可视化。很多人难以理解相关性和p值,但是如果能将这些复杂的关系转化为看得见的图表,那么就能够提高结果的可解读性。

提高学历水平

要成为数据科学家需要付出很多。教育经历是衡量数据科学家水平的重要因素。企业更喜欢在统计学、数学、计算机科学和物理学领域具有硕士学位的求职者,而在应用数学、统计学、计算机科学和宇宙科学拥有博士学位的求职者,则更加受到研究型公司和高级模型开发的公司的偏爱。

留言 点赞 发个朋友圈

我们一起分享AI学习与发展的干货

编译组:韦振琛、黄天元

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20181203B0Q3S700?refer=cp_1026
  • 腾讯「云+社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 yunjia_community@tencent.com 删除。

扫码关注云+社区

领取腾讯云代金券