首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >谁是数据科学家

谁是数据科学家

作者头像
大数据杂货铺
发布2020-02-11 16:16:48
4880
发布2020-02-11 16:16:48
举报
文章被收录于专栏:大数据杂货铺大数据杂货铺

数据科学到底是什么?

有的人称其为数据的土木工程,有的称其为学科。毕竟,数据科学到底是什么?

数据科学是EMC 2流行的术语。这是从“数据”中提取有价值的见解的过程。

随着我们生活在大数据 时代,数据科学正在成为一个非常有前途的领域,可以利用和处理从各种来源生成的大量数据。数据科学本身就是一门广阔的学科,由统计学,数学,编程,计算机科学等专业技能组合组成。数据科学由多种元素,技术和理论组成,包括数学,统计,预测分析,数据建模,数据工程,数据模拟和可视化。

数据科学学科不是一夜之间发展起来的。实际上,以业务分析或竞争情报的形式存在已经有很多年了,但是现在只有真正的潜力得以实现。数据科学的主要目的是有效地提取和解释数据,并以一种简单的非技术语言将其呈现给最终用户。

因此,数据科学就是关于构造有用的信息,从而将其转换为数据驱动的产品!

谁是数据科学家?

他/她是否整日忙于数据或在他/她的实验室中尝试复杂的数学?毕竟,“谁是数据科学家”?

Ť 这里有对数据科学家提供了一些定义。简而言之,数据科学家就是实践数据科学艺术的人。DJ PatilJeff Hammerbacher创造了一个非常流行的术语“数据科学家”。数据科学家是利用某些科学学科的专业知识来解决复杂数据问题的人。他们处理与数学,统计学,计算机科学等相关的几个要素(尽管他们可能不是所有这些领域的专家)。

数据科学家是业务分析师还是数据分析师,两者有所不同!

尽管所有这些学科的初始培训或基本要求都是相似的,但数据科学家需要:

农业科学家是否想知道今年小麦产量与去年相比增加的百分比(以及与之相关的原因),或者金融公司是否要根据客户的信誉对客户进行分类(在发放贷款之前)或零售组织是否要为忠诚客户奖励额外的积分,都需要数据科学家处理大量的结构化和非结构化数据,以便做出关键的业务决策。

当今的数据科学家面临的主要挑战不是找到现有业务问题的解决方案,而是确定对组织及其成功至关重要的问题。

为什么数据科学家被称为“数据科学家”?

考虑到数据科学家从科学领域和应用程序中提取大量信息(无论是统计数据还是数学数据)这一事实后,创造了“数据科学家”一词。他们大量使用最新技术来寻找解决方案并得出结论,这对于组织的成长和发展至关重要。与结构化和非结构化形式提供给他们的原始数据相比,数据科学家以更有用的形式显示数据。

就像任何其他科学学科一样,数据科学家总是需要询问并找到关于他们可用数据的什么如何为什么的答案。他们需要制定明确的计划,并努力在有限的时间,精力和金钱内取得成果。

数据科学的三个组成部分

数据科学包括三个部分,即组织,打包和交付数据(数据的OPD)。让我们简要地看一下这些:

1.组织数据: 组织是在应用数据处理最佳实践之后对数据的物理存储和结构进行计划和执行的地方。

2.打包数据: 打包是创建原型,应用统计信息和开发可视化的地方。它涉及在逻辑上以及美学上以可呈现的形式修改和组合数据。

3.交付数据: 交付是叙述故事并获得价值的地方。它确保最终结果已经传递给相关人员。

数据科学家具备哪些技能?

数据科学家的作用确实是具有挑战性的!尽管数据科学家使用的技能和能力差异很大,但要成为一名高效的数据科学家,他应该:

1. 在创新地运用各种技术来提取数据并获得解决业务问题和挑战的有用见解方面,他非常有创新性和与众不同。

2. 有能力定位和解释丰富的数据源

3. 有一个动手的数据挖掘技术的经验,如图形分析,模式检测,决策树,聚类或统计分析。

4. 通过应用实验性和迭代性方法与技术来开发运营模型,系统和工具。

5. 从各种来源和角度分析数据,并找出隐藏的见解。

6. 执行数据调节 –即通过应用统计,数学工具和预测分析将数据转换为有用的形式。

7. 研究,分析,执行和提出统计方法以获得实际见解。

8. 即使在硬件,软件和带宽限制期间,也可以管理大量数据

9. 创建可帮助任何人轻松了解数据分析趋势的可视化文件

10. 成为团队负责人,并与其他业务分析师,产品经理和工程师进行有效沟通。

简而言之,数据科学家应该在所有这些技能(编程,统计,数学,商业技能)中都非常强大,并且同时具有相关技能集的工作知识。例如,具有强大统计背景的人可以成为数据科学家,同时获得编码和业务方面的大量技能。

数据科学家就像网站管理员一样,不仅需要成为所有行业的杰作,而且还需要掌握以上领域中的至少一个。

数据科学家做什么呢?

数据科学家扮演着双重角色-“分析师”和“艺术家”!数据科学家非常好奇,他们喜欢大量的数据,而且,他们更喜欢玩这么大的数据以得出重要的推论和发现趋势!这就是数据科学家与传统数据分析师的不同之处。数据科学家不仅引用诸如社交媒体网站或日志文件之类的一种特定来源,而且还引用其他各种来源,旨在找出隐藏的见解,这些见解对组织而言非常重要。他们进行“假设分析,从不同角度提出问题并查看数据,并将大数据转化为下一个大创意!

这是著名的数据科学家Drew Conway所说明的Conway Venn数据科学图。该图将数据科学作为急需的技能(例如黑客技能,数学技能和包括专业知识在内的统计知识)的组合来呈现。

1.5.1. 数据科学也是一门艺术!

数据科学不仅是一门科学或一种技术,而且还是一门“艺术”。数据科学是一门聆听直觉的艺术,同时面对大量数据,对其进行分类,评估并得出结论。并非所有人都对此艺术感到满意!数据科学家需要真正发挥创造力,以各种图形形式可视化数据,并以非常简单和友好的方式呈现高度复杂的数据!如果数据科学家能够将可怕的PB级结构化和非结构化数据(图像,视频,日志文件等)转换为非常简单的格式,那么他就是“艺术家”!

数据科学家的职位

“美国面临14万至190,000人的短缺,这些人拥有深厚的分析技能,还有150万名拥有大数据分析知识以做出有效决策的管理人员和分析师。” –麦肯锡全球研究所

由于数据科学是一个新兴领域,因此在世界范围内存在大量的机会。 只需浏览任何工作门户即可;您会为不同行业的数据科学家提供的职位空缺感到惊讶,无论是IT还是医疗保健,零售或政府办公室或学术界,生命科学,海洋学等。风险投资家从未在投资方面表现出如此激动像数据驱动的初创公司一样赚钱。

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2020-01-03,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 大数据杂货铺 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
大数据
全栈大数据产品,面向海量数据场景,帮助您 “智理无数,心中有数”!
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档