首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

从事数据科学,除了遵从维恩图,还需要……

全文共1924字,预计学习时长4分钟

尽管与数据科学相关的学科很早就出现了,数据科学还是一个相对较新的领域。为什么数据科学没有一个明确的的定义呢?在谷歌上搜索“什么是数据科学”会得到1.590.000.000条结果,但搜索“什么是计算科学?”只能得到1.220.000.000条结果。考虑到计算科学要比数据科学出现得早,这样的结果着实令人惊讶。

如果你曾研究过什么是数据科学,你可能见过“数据科学维恩图”。Alluvium公司的首席执行官兼创始人康威(Drew Conway) 是2010年最早引入这种图形的人之一。另一篇发表于2009年的文章中,作者是余铭轩(Nathan Yu),详细地阐述了这一韦恩图的各组成部分。下面让我们来看看“数据科学维恩图”:

这种图形的优势显而易见。它易于理解,显示出数据科学其实是多个领域的有机结合。在这个维恩图中,三个组成部分分别是黑客技能、数学和统计知识,以及扎实的专业知识。现在,这个维恩图在网上衍生出有很多版本,但本质上都是以这三部分为基础的。

为什么数据科学维恩图具有误导性?

数据科学维恩图并没有错。它在显示数据科学重要组成部分的同时也说明了数据科学是这些领域的交叉。因此,如果你对数据科学一无所知,只是想大致了解一下,维恩图就很适合你。

然而,如果你想深入探究数据科学这个看似无穷无尽的领域,这个维恩图,最好可以算作一个探索的起点,最差则会误导人。著名统计学家约翰·图基(John Tukey)(1962)曾经表示:

对于往往是模糊的正确问题的近似回答,要比对于总是搞得很精确的错误问题的准确回答好得多。

许多试图解释什么是数据科学的文章迟早会用上这种韦恩图。从描述如何成为一名数据科学家的文章数量可推测出有不少读者可能希望自己成为数据科学家。这正是维恩图的问题所在。

为什么软技能在数据科学中很重要?

维恩图是一个抽象概念。一个抽象概念必定无法体现复杂的现实情况。不过,将这个维恩图称为“数据科学硬技能维恩图”之类可能会更加合适。

这个维恩图的组成部分都属于硬技能——一类易于评估的技能,比如可以通过笔试来衡量。而软技能,有时又指人际交往能力,通常不能通过笔试来衡量。软技能包括能够有效地在团队中工作、与团队中的其他人(包括非技术员工)沟通以及能够领导和管理团队的能力。

现在,公司聘请数据科学家后,不会让他们在工作时与其他部门隔离。他们聘请数据科学家是希望数据科学家根据可创造价值的数据中提出实质性的见解。因此,数据科学家首先应熟知其所在公司的商业模式,以及公司的盈利模式。这是为了确保目标一致:即盈利。没有足够多的软技能,再最能干的数据科学家也很难实现这个目标。

设想一下大多数公司对数据科学的看法:

现今关于数据科学项目的现实情况是,大多数公司的管理层并不关心处在中间环节的数据科学相关细节,这是聘用来的数据科学专家们要操心的事。公司管理层只负责做出有助于公司盈利的决策。因此,掌握做数据科学必需的技术知识与必要的软技能都至关重要。

成功完成一个数据科学项目需要的三个最为显著的软技能包括:

1. 灵活思维

首先从业务问题开始。要想解决某个难题,先要弄清楚问题出在哪里。在公司,你会遇到一些业务问题——它们得到解决后将为公司创造价值。问题可能各种各样,比如创建一个仪表板来简化和加速管理决策的过程,或使用机器学习来预测销售额增长趋势。

没有技术背景的公司管理人员不一定了解关于数据科学的所有细节(他们也不必了解)。他们遇到问题后就会探索新的解决方法。因此,这些业务问题通常不会被事先明确地提出。

判断运用数据科学是否能解决问题以及解决哪些方面的问题是数据科学家们的职责。由于大多数数据科学家没有商业背景,他们在工作过程中可能会遇到一定障碍。能够在商业和技术两种思维方式之间切换自如是有效解决业务问题的一项基本技能。

2. 团队合作

在可视化的第二阶段中,数据科学维恩图中提到的硬技能绝对十分重要。然而,软技能也是必备技能。最重要的一点是,数据科学家要能在任何类型的团队中有效工作。

公司的组织结构决定着数据科学家的角色,或是团队中唯一的数据科学家,或是作为大型分析团队中的一员和其他数据科学家、数据仓库专家等一起工作。高效分配任务并使整个团队朝着共同目标努力是成功的另一要素。

3.有效交流和表达

交流主要是指与团体中没有技术背景的员工的交流。用通俗的语言对数据科学团队的工作内容进行解释填补了数据科学装饰性和有效性之间的鸿沟。解决了技术方面问题后,数据科学家需要将他们的发现传达给管理层。汇报要做得有趣且吸引人则需要反复练习。

然而,技术专业的课程很少涉及到软技能的培养。一个出色的汇报包括,从有效的幻灯片设计到令人感兴趣的文案撰写等多个元素。

结论

要想成为一名真正的数据科学家,软、硬技能兼备才是王道。因此,一个人若想成为一名数据科学家,也应多关注自身的软技能。无论是通过自学还是在大学里学习交际类课程,提升自身的软技能总是一项明智的投资。

留言 点赞 发个朋友圈

我们一起分享AI学习与发展的干货

编译组:杨雨心、张婷华

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20190428A06D6100?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券