专栏首页华章科技一张图告诉你如何8步炼成数据科学家

一张图告诉你如何8步炼成数据科学家

如何成为一个数据科学家?不少刚刚接触这个领域的探索者都在寻找一条尽可能正确的道路。

OK,这条道路确实不是无迹可寻的。虽然并不简单,但是,通过科学的规划和足够的时间投入,数据科学家可以通过很少的花费炼成。

接下来的这张精美的可视化长图从什么是数据科学家说起,然后详细介绍炼成数据科学家的8个步骤。拿好不谢~

首先,什么是数据科学家?数据科学,是一个多学科知识的交集,甚至包括黑客技巧。数据科学家,是比软件工程师更擅长统计学,比统计学家更擅长软件工程的人。目前,数据科学家的典型教育背景是:高中5%,技校5%,大专14%,本科37%,硕士/专业学位31%,博士9%。

第一步:学好统计、数学和机器学习

数学:可汗学院(Khan Academy)的数学,MIT公开课的线性代数;统计学:Udacity和Openintro;机器学习:Stanford在线中吴恩达(Andrew NG)的机器学习,Coursera上John Hopkins的实用机器学习

第二步:学习编写代码

掌握计算机科学的基础知识;掌握从头至尾的开发过程(end-to-end development),因为你做的东西终将被整合到其它系统中;确定你的首选编程语言,开源的R , Python等,商业软件SAS, SPSS等。用DataCamp, tryR, Codecademy和Google Class进行交互式学习。

第三步:理解数据库

作为学生,你会经常与文本数据打交道。但是,一旦进入该领域,你会发现该领域几乎都是用数据库存储数据,如MySQL, Postgres, CouchDB, MongoDB, Cassandra等。

第四步:掌握数据整理、可视化和报表制作

1)数据整理,是将原始数据转换成方便实用的格式。可自学Coursera中John Hopkins的Getting and Cleaning Data课程,实用工具有DataWrangler和R。

2)数据可视化,是创建和研究数据的视觉表现。实用工具有ggvis, D3, vega。

3)数据报表,作为数据分析的最后一步,是将数据分析和结果制作成易于理解的报告。实用工具有Tableau, Spotfire和R Markdown。

第五步:提升到大数据级别

当你开始处理网络级规模的数据时,数据分析的基本方法和过程就都改变了。绝大多数的数据科学家要解决的问题,都无法在单机上完成。他们面对的是需要分布式处理的大型数据集,使用的工具是Hadoop,MapReduce,Apache Spark。

第六步:获得经验、实践,结交大牛

[古人云:]熟能生巧!你可以参加比赛,结交数据科学专家,通过小项目小试牛刀,培养自己的直觉。

第七步:实习、实战、或找份工作

甄别自己是不是一个真正的数据科学家的最佳途径,就是用你新学的知识迎难而上,进入数据分析的丛林。

第八步:关注并参与社区

关注网站:DataTau, Kdnuggets, fivethirtyeight, datascience101, r-bloggers;关注大牛:Hilary Mason, David Smith, Nate Silver, dj patil; 需要数据?上quandl看看。

END

投稿或建议,请联系邮箱:holly0801@163.com。转载大数据公众号文章请联系出处申请授权,否则产生的任何版权纠纷与大数据无关。

本文分享自微信公众号 - 大数据(hzdashuju)

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2017-05-14

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 2016年“大数据”产业的“真实面目”

    “大数据”一词越来越火辣,煽情全球。出于一种职业精神和科学良知,我和我的团队,近几年来深入调研剖析“大数据”产业到底是怎么回事。从美国的SaaS、亚马逊、谷歌、...

    华章科技
  • 关于数据湖架构、战略和分析的8大错误认知

    导读:本文打破有关数据湖的8个错误认知,错误认知包括3方面,还提出了5个小技巧,以构建一个灵活的、可交付业务价值的数据湖。

    华章科技
  • 工业大数据:未来的“黄金”和“石油”

    2014 年,马云在北京参加活动时表示,如今的阿里巴巴从本质上来讲已经成为一家数据公司,淘宝的目的不是为了卖货,而是获得所有零售业和制造业的数据。同样,百度、腾...

    华章科技
  • 天龙八部:一张图告诉你如何8步炼成数据科学家

    如何成为一个数据科学家?不少刚刚接触这个领域的探索者都在寻找一条尽可能正确的道路。 OK, 这条道路确实不是无迹可寻的。虽然并不简单,但是,通过科学的规划和足...

    小莹莹
  • 回顾2016年大数据发展,盘点十大热门数据岗位

    随着很多大公司对数据分析需求增多,数据相关岗位的人才需求量也越来越大。 数据学作为一门学科,已经受到时代的追捧。数据学,或者更准确来说,大数据,在2000年早...

    灯塔大数据
  • 大数据时代 三个“关键词”

    “十三五”时期,实施国家大数据战略,就是把大数据作为基础性战略资源,全面实施促进大数据发展行动,加快推动数据资源共享开放和开发应用,助力产业转型升级和社会治理创...

    钱塘数据
  • ☞2018政府数据要开放?先看看现在长啥样【真相】

    被堵成狗的种子君在国庆回来上班第一天就听说,发改委表示2018年将建成政府数据统一开放门户。听到这个消息,种子君不禁心中窃喜,脑补如下画面: 政府数据公开--拿...

    小莹莹
  • 大数据如何改变商业?浅谈大数据给商业(企业)带来的影响

    在20世纪,价值已经从有形基础设施变成了无形财产,从土地和工厂变成了品牌和产权。而现在进入21世纪,新的变革正在进行中,也就是说,计算机存储和数据分析方法已经取...

    数据前沿
  • 大数据分析的特点有哪些?这五点很常见

    在当今的大数据时代,不仅IT行业的人们需要了解与大数据相关的知识,而且传统行业的从业者和普通大学生也应了解某些大数据知识。新的基础架构计划未来,大数据技术将开始...

    数据前沿
  • 大数据与传统数据

    大数据与传统数据相比的主要特点可以概括为:数据量“大”、数据类型“复杂”、数据价值“无限”。

    博文视点Broadview

扫码关注云+社区

领取腾讯云代金券