面对数据工程师,你有7个问题可以问

运用数据进行管理不是什么新鲜事,但是大数据还是个新概念, 有相关的风险、挑战和机会。高级管理者需要具备一定的认识,以备他们的数据专家提出新观点时,自己有所准备。下列这些问题专为他们而准备,帮助他们更深入地了解数据并且尽量避免数据可能引发的灾难。

记住,当你的数据工程师说起一个新点子时,你应该向他提出下面这些问题:

1.你想解决的是什么问题?

对于数据工程师或者其它相关人员,找到一些新的应用或者好玩的东西实在太容易了,问题是这些东西是否与业务相关。鼓励他们去关注现实存在的问题,实现小的创新和改进,一次只做一件事,等时间长了,信任增加,就可以减少对他们的管控,前提是你能分清探索 “新路径”和原地打转之间的区别。

2.你真的明白这些数据意味着什么吗?

人们经常在不太理解数据背景的情况下就开始收集,从一开始的时候就有误解,等发现时已经太晚了。所有的数据,无论量有多大,都是非常精微的事物。NASA曾有一架火星登陆器坠毁,就是因为其中的一个团队使用英国力矩计量单位“英尺*英磅”,而其它团队使用“牛顿”为单位,这类区分会使得数据看起来大不相同,尤其是通过不同的社交媒体平台或者自动分析系统收集来的数据,会有这样的问题。

3.我们应该信任数据吗?

靠不住、不准确的数据非常多。坏零件组装不出好汽车,同时,错误的数据再怎么分析也得不到正确结果。有些数据天生就不准确,比如 GDP预测一类,另一类数据则是在流程中失掉了精确性,有时候数据收集就是一个不断出错的过程,看看银行错误百出的信用评级报告就知道了。除非有一套非常好的系统流程来保证质量,否则就要假定得到的数据并不准确。

4.有没有一些重要因素,诸如隐性的判断、先入为主的前提或者自相冲突的数据结果使你对数据的认识发生偏差?

这种情况很常见。首先,我们都希望能从数据分析中获得回报,这就产生了一种效应,即人们总会看见他想要看见的东西。比如说,你期望看到10%的收入提升,你手下的人就会找到短期内增长10%的证据,但是过分关注眼下的10%,可能会失掉从数据中发现未来 100%增长的机会,或者干脆看不到负面趋势的警示。

其次,先进的数据分析需要超强的判断力。数据专家倾向于只看数据而忽视其它因素,你得保证这种事不要发生。你越重视他们的工作结果,他们提供给你的数据就越清晰完整。

第三,分析的意义在于更深入地了解世界运行的方式。错误的假设和前提非常有害。举例来说,金融危机的一个重要原因就是大家都先入为主地认为房产价格与股市无关,结果成了悲剧。

5.你的结论是不是建立在对市场的全面理解、对条件变化的认识以及对最坏情况的心理准备的前提之下?

不要将数据分析看成传统的物理或者数学研究,验证数据结果可不像伽利略从塔上丢下物体的那类古老实验,数据科学家必须是怀疑论者,不相信别人的结果,不断地检验、检验、再检验,他们要尽量全面地描述数据中可能存在的不确定性。这很重要,因为你的数据来源往往是超出数据科学家的控制之外的,他们不知道来龙去脉,因此需要明确地指出结论中的不确定在哪里,供管理者进行判断。

6.谁将会受到影响?方式如何?

数据的爆炸式增长使得人们的隐私成为大问题。无论在组织内部还是外部,在“有用”和

“侵犯隐私”之间仅有一线之隔,数据科学家的洞察力非常惊人,可是他们并不了解这些结果背后的意义和风险,这些问题应该由管理者而不是他们来解决。

小心一些,不要让业务与数据之间的联系过分敏感。你需要关注的其实只是纽约证券交易所的瞬间暴跌或者推特上的负面言论带来的业务下滑。

7.我能为此做些什么?

如果前六条都没解决,这个问题自然也不会出现。时刻想着重要的发现会对整个组织产生影响,我们都很关注变革管理,变革总是困难并且阻力重重的,光靠数据分析师无法实现,需要管理者的参与。

除了第一个和最末一个问题,其它的问题只要一提出来,管理者就会开始思考。不过有经验的数据分析师也会想到这些事,有说服力的答案能够帮助管理者和数据分析家们从大数据中发掘对业务有意义的内容。(Via:中国统计网)

原文发布于微信公众号 - 大数据挖掘DT数据分析(datadw)

原文发表时间:2015-03-12

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏AI科技评论

线性资本王淮:明年人工智能泡沫将达到顶点

虽然说当下几乎各行各业都在拥抱人工智能,但你是否知道人工智能曾经有过一段时间被忽视,且只能以数据挖掘、机器学习等其他称呼来进行代替? ? 近日由网易科技和网易智...

3049
来自专栏大数据文摘

行业 | 我的数据科学成果为什么无法商业化?

1384
来自专栏大数据文摘

独家专访 | 微软郑宇:这个时代不缺数据,缺得是不够开放的思维

2656
来自专栏企鹅号快讯

人工智能的界定

在2017年,“人工智能”这个词得到了公众前所未有的关注,究其原因我认为与两方面有关,一方面人工智能学术领域自身产生了一些进步,另一方面则更多与媒体和业界噱头式...

2217
来自专栏DT数据侠

你忙着追热点了解世界,有人却在用阅读大数据了解你 |DT Labo Online

前不久,DT君请来了今日头条算数中心汽车数据的负责人朱凌(朱大哥),带小伙伴们探索了汽车和手机行业阅读大数据背后的商业应用场景。当我们每天用手机浏览、转发、收藏...

800
来自专栏老九学堂

程序员面试的真正核心点是.....

程序员面试 作为面试官,他们从哪些角度来考察一个应聘的程序员是否合适公司的岗位呢? 通常情况下,面试官都会在与你的交谈中考量你的职业规划,综合能力,及行业经...

3346
来自专栏CDA数据分析师

回顾与展望丨数据科学 机器学习:2017年的主要发展和2018年的关键趋势

KDnuggets邀请了数据科学相关领域杰出的代表人物对2017年的主要发展和2018年的趋势进行了总结和预测。主要内容涉及到 AI 、深度学习、机器学习、安全...

2018
来自专栏AI科技评论

业界 | 英特尔中国研究院院长宋继强:融合 AI 与 SI 推进智能机器人产业

AI科技评论按:本文作者宋继强,英特尔中国研究院院长。 ? 宋继强 今天,我们正在拥抱一个万物智能互联的新世界。越来越多的物和设备通过网络实现互联互通,让数据呈...

3244
来自专栏数据的力量

谷歌百度脸书IBM,人工智能四巨头2014盘点

1935
来自专栏机器学习算法与Python学习

为什么说自然语言处理是人工智能的核心

关键字全网搜索最新排名 【机器学习算法】:排名第一 【机器学习】:排名第一 【Python】:排名第三 【算法】:排名第四 如果一台计算机能够欺骗人类,让人相信...

6796

扫码关注云+社区

领取腾讯云代金券