专栏首页大数据文摘你了解数据科学家有几类吗?

你了解数据科学家有几类吗?

大数据文摘翻译作品

作者:VincentGranville

翻译:罗康,阚玺, 孫柒柒

校对:陈洁

如需转载,后台留言申请授权

欢迎熟悉外语(含各种“小语种”)的朋友,加入大数据文摘翻译志愿者团队,分别回复“翻译”和“志愿者”可了解更详细信息。

统计根据不同的领域(生物,营销,产品,金融等)分有多类统计学家,比如:生物统计学家、经济学家、运筹学专家、精算师和商业分析师等。在数据科学领域,也有不同类别的数据科学家。他们首先工作职位不同,比如我的工作职位就是一个数据公司的联合创始人(译者:DataScience Central公司,主要业务是给业界提供大数据的在线服务。包括从数据分析到集成和实现可视化全套流程。)

我们将数据科学家分为以下九类:

(1)精于统计类。他们的主要工作是针对大数据开发新的统计理论。他们专注于非传统统计的统计建模,实验设计,抽样,聚类,数据缩减,置信区间,测试,建模,预测建模等相关技术。

(2)精于数学类。比如NSA(国家安全局)和国防/军事工业领域内的大数据专家,天文学家和运筹学家。他们专注于对业务的分析和优化,比如库存管理和预测,定价优化,供应链,质量控制,成品率优化等。他们主要的工作在于收集,分析数据并从中提取关键价值。

(3)精于数据工程,Hadoop,数据库/记忆/文件系统最优化和架构,API,作为服务的分析,数据流最优化,数据探究。

(4)精于机器学习/计算机科学类(算法,计算复杂性)

(5)精于商业类,ROI最优化,决策科学。这些领域实际是大公司中商业分析师们所做的的一些传统的工作的一部分(例如数据报告设计,考量的混合选择以及考量的定义,ROI最优化,高水平的数据库设计)。

(6)精于生产代码的开发,软件工程(他们懂得很多编程语言)。

(7)精于数据可视化类。

(8)精于GIS,空间数据,图形数据建模,图形数据库。

(9)精于以上多样。有着20年在大大小小的公司跨领域的工作经历,有些数据科学家既精通统计,又懂得机器学习,商业,数学而且还擅长可视化和数据工程。随着时间的推移,随着经验的积累,你也可以变成这样的多面手。我之所以提到这点是因为很多人仍然认为开发跨多项领域的专业技能是件不可能的事情或传统上认为跨领域的技能是分隔开来的。事实上,这种多能手便是数据科学的定义。

以上所提到的这些人中绝大多数都非常熟悉大数据甚至可称得上大数据专家。

此外,我们还有其他几种数据科学家分类法,具体可参看我们之前的文章“数据科学家的分类”(Taxonomy of datascientists)。有一种分类法是基于有无创新性的差异。有创新性前景会更好,而缺乏创新容易被外包。任何已出版的教材或已流行于网络上的都可以实现自动化或外包,而我们的工作保障就是不可替代性,是基于你知道多少别人不知道的内容或者你比别人更容易学会什么。按照这样的思路,我们可分为科学应用型人才(指那些使用科学且通常不具有博士学位的从业者),科学创新型人才(指那些创造新科学的研究人员),以及混合型人才。大多数的数据科学家都属于科学应用型人才,比如会预测地震的地质学家,会为制药公司设计新的药物分子的化学家和科学家们,他们多属于此类数据应用型人才。

对IT行业人士的启示

如果你是工程师或商业分析师,那么你的工作很可能已包括一些数据科学,而转型成为数据科学家的难度,或许也没有那么难。而如果你关心的是数据科学家这个潮流职业是否会对你现有的工作构成威胁,那么请阅读原文中的参考链接,它会给你有效建议,拓宽你的职业前景。

原文:http://www.datasciencecentral.com/profiles/blogs/six-categories-of-data-scientists

【译者简介】

阚玺

2012年获得了美国纽约州伦斯勒理工学院决策科学专业(Decision Science)的博士学位。Cathy对于决策模型的建立,运筹管理以及数据挖掘与分析等多项领域具有浓厚的兴趣。毕业后,Cathy成为了一名资深的商业决策分析师,先后加入Memorial Sloan-Kettering Cancer Center 的战略计划团队和全RetailMeNot, Inc.的商业智能和分析团队工作。这些团队主要负责运用大数据分析向公司管理决策层提供有价值的商业决策建议。

2015年Cathy希望通过大数据文摘平台广泛结交业内人士及爱好者,并希望有机会多多参与国际国内大数据和电子商务相关的会议及交流活动。

陈洁

统计分析师,Emory大学生物统计硕士,曾在美国疾病防控中心CDC实习一年,先后就职于美国国立卫生研究院肿瘤所 NIH/NCI,与BioStat Solutions统计咨询公司。现为大数据文摘翻译组组长, 希望结交对大数据感兴趣的朋友,共同学习进步。

大数据文摘ID:BigDataDigest

专注大数据,每日有分享

覆盖千万读者的WeMedia联盟成员之一

本文分享自微信公众号 - 大数据文摘(BigDataDigest)

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2015-02-05

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 贝恩咨询:大数据的三个误区及危险

    大数据文摘
  • 未来战争,军事大数据决定主动权

    大数据文摘
  • 刘晨:大数据怎能没有你--数据治理

    大数据文摘
  • 数据库系统的特点

    爱学习的孙小白
  • 从初具雏形到平稳运行,大数据平台如何在互联网行业发展?

    导读:本文是58同城信息系统部高级经理余中洋对大数据在互联网行业应用的总结。以实际经验讲解了大数据从雏形到发展,以及发展过程中传统数据仓库到大数据平台的转化和大...

    钱塘数据
  • 年薪30万-50万,站在风口上的大数据面临150万的人才紧缺

    大数据人才缺口达150万 全球最顶尖管理咨询公司麦肯锡(McKinsey)出具的一份详细分析报告显示,预计到2018年,大数据或者数据工作者的岗位需求将激增...

    顶级程序员
  • 未来战争,军事大数据决定主动权

    大数据文摘
  • 2016大数据版图

    原文是 FirstMark Capital 的 Matt Turck 的文章。本文全面总结了大数据领域的发展态势,分析认为尽管大数据作为一个术语似乎已经过气,但...

    华章科技
  • 大数据平台架构+ETL

    ETL,Extraction-Trasformation-Loading,即数据读取,转换,装载的过程,是构建数据仓库的重要环节。

    可爱见见
  • 刘晨:大数据怎能没有你--数据治理

    大数据文摘

扫码关注云+社区

领取腾讯云代金券