过快、过量、过度:三类数据驱动型决策中的常见问题(附大量资源)

大数据文摘作品,转载具体要求见文末

作者|Elena Sigacheva 选文 | Aileen

翻译|Elaine琏 校对|饶蓁蓁Sabrina

在大数据的时代,很多公司通过采用数据驱动方式进行决策。在本文中我想谈一下我们在数据分析过程中三种常见失误:过快--急于求成、过量--图囵吞枣、过度--信息过载。

(注:本文附大量外链资料,建议先收藏再查看)

过快:急于求成

还没找到实际问题就提出解决方案

不要担心在定位问题上花费太多时间。关于越早开始行动,越能提前完成项目的理论不一定正确,如果未能充分理解关键问题可能会浪费更多时间。无论你是在思考一个新的产品特性,对公司未来发展方向的战略决策,建立机器学习模型,还是给你的同事写邮件,都要确保你有花时间去了解项目的真正需求,而不是浪费了大量时间和精力后才发现方向错了。

别忘了,你所要解决问题的类型决定了对应的解决办法。比如在数据科学领域,建立模型前必须要了解该模型是为了加强调用(你的模型在多大程度上可以反馈特定数据),还是加强准确性(在所有正向预测中,有多少是准确的)。从最初开始定位项目目标有助于增强模型的准确性,降低漏报(针对调用)及报错(针对准确性)发生的可能性。

《哈佛商业评论》一篇相关文章推荐了以下方法帮助你解决真正问题

(相关链接:https://hbr.org/2012/09/are-you-solving-the-right-problem)

第一步:设定解决方案的需求

第二步:调整该需求

第三步:将问题情境化处理

第四步:写下问题陈述

另一个著名方法是MBA项目教授的“五问法”,一种由丰田集团开发的问题解决技巧,有助于通过重复拷问“为什么”来触及问题的根源。

(相关链接:https://en.wikipedia.org/wiki/5_Whys)

过量:图囵吞枣

对于重要的和无关紧要的指标不做区分

生活在大数据时代,我们能通过大量工具追踪各类用户活动,拥有各种指标来定义每一个用户的行动。然而有多少指标是真正有用的?你能够通过观测这些指标来得出可行的方案么?

重要的是质量而非数量。比起追踪全部的数据,不如试着找出那些真正能够衡量产品健康程度并加以改善的关键绩效指标(KPI)。根据商业模式,公司目标和产品生命周期,决定哪些KPI是你需要关注的重点。

我推荐大家了解下Dave McClure的演讲,他将项目开发的指标分成了五类:

用户获取

用户激活

用户留存

用户推荐

收益增加

(相关链接:http://www.slideshare.net/dmc500hats/startup-metrics-for-pirates-long-version/2-Customer_Lifecycle_5_Steps_to)

大数据文摘后台回复“常见问题”下载Dave McClure的相关演讲ppt

另一个知名的极简方法是《精益数据分析》(Lean Analytics)中提到找到“第一关键指标”(详见下方链接)。

https://growthhackers.com/videos/video-lean-analytics-one-metric-that-matters-omtm/

过度:信息过载

试图发现根本不存在的模式

因为我们的直觉并不总是对的,而数据有时令人惊讶,尽管我们一直在寻求通过数据驱动进行决策,应用常识也很重要。要记住,模型世界并不是世界本身。你的模型存在假设和局限性,有时这些会将你引入歧途。不管模型告诉你什么,无论是肯定了你的预测还是告诉你特殊结果,你都要用自己的判断力,思考预测正确的概率以及信号的强烈程度。

有时候被发现的并不是“真相”。我们可能没有意识到,自己自己有时在无意识的寻找不存在的信号。通过了解行业的更多方面,竞争格局,宏观经济因素,周期性影响和其他因素有助于更准确的设定增长目标并依据数据得出科学的结论。例如,某些参与指标的下降不一定是消极型号,可能只是周期性影响,客户投诉的增加可以是一个健康增长的迹象,因为它体现了用户基数的上升。

“相关性不一定是因果关系”在统计学中,这用来强调两个变量之间的相关性并不意味着一个因素会影响另一个。有时人们阅读博客是为了优化他们的数据驱动决策,有时事情就这么发生了。:-)

素材来源:https://engineering.entelo.com/too-fast-too-many-too-much-three-common-mistakes-when-making-data-driven-decisions-ed0251dcea27

关于转载如需转载,请在开篇显著位置注明作者和出处(转自:大数据文摘 |bigdatadigest),并在文章结尾放置大数据文摘醒目二维码。无原创标识文章请按照转载要求编辑,可直接转载,转载后请将转载链接发送给我们;有原创标识文章,请发送【文章名称-待授权公众号名称及ID】给我们申请白名单授权。未经许可的转载以及改编者,我们将依法追究其法律责任。联系邮箱:zz@bigdatadigest.cn。

原文发布于微信公众号 - 大数据文摘(BigDataDigest)

原文发表时间:2016-11-28

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏ATYUN订阅号

谷歌发布Edge TPU芯片和Cloud IoT Edge,将机器学习带到边缘设备

谷歌为其机器学习框架TensorFlow定制的芯片——TPU正在向边缘设备发展。在旧金山举行的Cloud Next会议上,谷歌宣布推出Edge TPU和Clou...

1532
来自专栏架构师小秘圈

为什么说21世纪是一场ABC的革命?

作者:刘超,毕业于上海交通大学,15年云计算领域研发及架构经验,先后在EMC,CCTV证券资讯频道,HP,华为,网易从事云计算和大数据架构工作。

1203
来自专栏AI科技大本营的专栏

跨界 | 隐形AI与设计

作者 | 卢智雄 作为一个设计师,我对现在的AI浪潮的态度起初是:听起来很棒,但跟我这个设计师有什么关系呢? 我对所有的趋势保持谨慎态度,何况现在媒体鼓吹的人工...

3469
来自专栏ATYUN订阅号

【方法】搜索引擎如何使用机器学习:我们需要知道的9种方式

? 当我们在2010年初初次听到机器学习的时候,可能会感觉它很可怕。 但当我们意识到技术已经被用来为我们提供解决方案时,我们就开始着手解决实际问题: —搜索引...

3939
来自专栏纯洁的微笑

终于有人把云计算、大数据和人工智能讲明白了!

2155
来自专栏ATYUN订阅号

【业界】微软发布高级AI工具,减轻AI从业人员的负担

微软的Cognitive Services(认知服务)是该公司托管的AI算法的集合地。今天,该公司宣布推出几项Cognitive Services(认知服务)工...

3125
来自专栏钱塘大数据

终于有人把云计算、大数据和人工智能讲明白了!

导读:云计算、大数据和人工智能,这三个东西现在非常火,并且它们之间好像互相有关系:一般谈云计算的时候会提到大数据、谈人工智能的时候会提大数据、谈人工智能的时候会...

1754
来自专栏AI研习社

硅谷老司机 Siraj 教你找工作:简历写得好,工作跑不了

大家好,这里是 Siraj 的新课,在教你如何成为一名自由职业者之后,我又将和大家分享如何写一份优秀的简历,来申请有关机器学习或者数据科学的职位。

1061
来自专栏Web项目聚集地

「长文预警」云计算、人工智能、大数据到底是啥玩意?

我今天要讲这三个话题,一个是云计算,一个大数据,一个人工智能,我为什么要讲这三个东西呢?因为这三个东西现在非常非常的火,它们之间好像互相有关系,一般谈云计算的时...

1252
来自专栏媒矿工厂

全景媒体的系统架构研究综述

6193

扫码关注云+社区