首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >数据科学家养成记:成为数据科学家八步走

数据科学家养成记:成为数据科学家八步走

作者头像
小莹莹
发布2018-04-20 18:40:19
8730
发布2018-04-20 18:40:19
举报

但如何能成为一个数据科学家呢?

首先,各个公司对数据科学家的定义各不相同,当前还没有统一的定义。但在一般情况下 ,一个数据科学家结合了软件工程师与统计学家的综合技能,并且在他或者他希望工作的领域拥有大量的行业知识和经验。

大约90%的数据科学家至少有大学教育及以上经历,甚至到博士以及获得博士学位,当然,他们 获得的学位的领域非常广泛。

一、擅长统计学、数学和机器学习。

一个好的数据科学家必须能够理解数据告诉你的内容,做 到这一点,你必须有扎实的基本线性代数,对算法和统计技能的理解。在某些特定场合可能需要高等数学,但这是一个好的开始场合。机器学习是下一个新兴词,却和大数据有着千丝万缕的联系。 机器学习使用人工智能算法将数据转化为价值,并且无需显式编程。

学习推荐:

2、学会编程。

数据科学家必须知道如何调整代码,以便告诉计算机如何分析数据。从一 个开放源码的语言如Python、R语言那里开始吧。进一步学会SAS、spass,让你应用随心所欲!

3、了解数据库、数据池及分布式存储。

作为一个数据科学的学生,你经常是通过文本文件的方式与数据打交道。然而一旦进入企 业,存储数据更多的是采用数据库。常见的数据库有MySQL,Postgres,MongoDB,Cassandra 等

4、掌握数据处理、可视化和数据报告。

数据清洗和处理:数据处理是把原始数据转换为另外一种格式以便更好观察数据的过程 工具

数据可视化:数据可视化包括创建和研究数据的可视化表达

数据报告:最后一步是把数据分析结果写在一份让人容易理解的数据报告里

5、善于利用大数据,学习更多的工具。

当你开始处理海量的网络数据时,原始的分析方法和处理过程就不适用了。大部分数据科 学家处理的问题不能通过单机来完成,他们需要分布式处理系统来处理大数据集。

Hadoop是一个运行在计算机集群上,用于存储和处理大数据集的开源软件框架 MapReduce是一个使Hadoop集群具备大规模分布式处理能力的编程规范 Apchae Spark 是使hadoop具备实时处理数据能力的高速数据分析系统

6、提高、实践和向数据科学大牛学习。

实践才能让你“完美”,你可以 参加Kaggle的数据竞赛 在meetup上和数据科学大牛交流 私下里开始一个项目 锻炼你的数据直觉

7、参加实习,第一份工作和事业。

在你在新的领域有一个工作之前,你如何练习成为数据科学家?使用开源代码 开发一个你喜欢的项目、参加比赛、成为网络工作数据科学家、参加训练营、志愿者或实 习生。最好的数据科学家在数据领域将拥有经验和直觉,能够展示自己的作品,以成为应 聘者。

8、加入到一个学习社区。

参与一个学习社区,看相关视频,提出问题 ,并随时了解时事新闻和理论。目前,PPV课已开通数据科学家栏目,并且每日为大家带来大数据行业最新最干货的内容,欢迎大家关注微信公众号(ppvke123)。

以上所述看起来很复杂,如果按照步骤一步一步去找寻相关课程和书籍,相信你假以时日,必定会在成为数据科学家的道路上越走越远。一些免费学习网站见下图:

原文链接:http://blog.datacamp.com/wp-content/uploads/2014/08/How-to-become-a-data-scientist.jpg

1、回复“数据分析师”查看数据分析师系列文章

2、回复“案例”查看大数据案例系列文章

3、回复“征信”查看相关征信的系列文章

4、回复“可视化”查看可视化专题系列文章

5、回复“SPPS”查看SPSS系列文章

6、回复“答案”查看hadoop面试题题目及答案

7、回复“爱情”查看大数据与爱情的故事

8、回复“笑话”查看大数据系列笑话

9、回复“大数据1、大数据2、大数据3、大数据4”查看大数据历史机遇连载

PPV课大数据ID: ppvke123 (长按可复制)

大数据人才的摇篮!专注大数据行业人才的培养。每日一课,大数据(EXCEL、SAS、SPSS、Hadoop、CDA)视频课程。大数据资讯,每日分享!数据咖—PPV课数据爱好者俱乐部!

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2015-10-29,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 PPV课数据科学社区 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
大数据
全栈大数据产品,面向海量数据场景,帮助您 “智理无数,心中有数”!
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档