你不需要“大数据”——你需要的是“正确数据”

当今是言必称”大数据“的时代。在数以EB计的数据于(宽带)网络上流动传播的当下,各大公司竞相宣称自己掌握着最大且最具创新精神的数据集合。遍布商业圈的各色行业—无论老牌产业或是新兴行业,工业型或是数码类,规模巨大或是体量小巧—都不约而同的加入了角逐。

巨量的社会数据、天气数据、政府数据正被利用来预测供应链中断。大量的用户信息则被分析并用于在海量的网站点击中分辨出特定群体。企业们甚至已经开始处理巨量的文字交换(信息)以期建立起能够直接同顾客对话的算法。

然而事实却是我们对“大数据”重要性坚持不懈的聚焦往往会(引人)误入歧途。的确,在某些情况下,汲取数据中的价值需要(分析)大量的同类数据。然而对于业界内的革新者来说,问题的关键在于,数据的大小并不是最重要的因素—获取正确的数据才是(最重要的)。

与大小无关

优步(Uber)常常以“大数据”成功典范的身份被提及。毫无疑问,优步确实掌握了大量的信息。通过在加盟司机和用户们(的手机上)共同运行的应用程序,优步构建出了一张实时流动的客流运输地图。

然而优步的成功并非其搜集的“大数据”所带来的成果,这些海量的信息的确为公司开拓了不少新市场并满足客人生活中新产生的各类任务和需求。优步的成功来源于一些与众不同的东西:那些微小的,正确的,也是其本身亟需的用以达成最简单任务的数据 —(何时何地)发车。

在我们还没法只在智能手机上按一个按钮就召来一辆车的时代里,人们依赖的是一种被称为“出租车”的事物,出租车,基本上都不会连入英特网或是其他任何正规的电脑设备,其实正是在“识别乘客”中扮演了”大数据”的处理者。为什么这样说呢?出租车系统本身就要求(司机)的眼球扮演扫描系统以在城市中搜索出那些伸出手臂的人形影像(招手的乘客)。尽管这些数据不通过Intel、HP的企业级服务器大量计算来处理,完成该工作所需处理的信息仍是海量的。该计算由人脑完成,并不改变所需捕获及分析的数据量。

优步的卓越之处在于叫停了(这种)基于视觉搜集数据的“生物自主探测”算法—而仅仅是去获取完成工作所需的正确数据。谁需要打车,他在哪里?仅这一条关键信息就让如优步,来福车和滴滴出行等(公司)为整个行业带来了革命性的改变。

为工作任务找到正确的数据

有时正确的数据很“大”;有时又很“小”。但对于革新者来说关键在于找出那些推动(企业有利)竞争地位的至关重要的数据。这些就是应当被倾力发掘的“正确数据”。为了得到它们(正确数据),我的建议是问问自己以下三个问题,以便循序渐进达到目标。

问题1:什么样的决策在你的行业里影响浪费?大多数行业内都存在着大量导致浪费的源头。以花卉销售业为例,花卉零售商平均来说可以承受存货超过50%的腐败率。(意味着)超过半数的花卉直接就报废了。因此对于像UrbanSterns和Bouqs这样革新者来说,那些对行业产生颠覆性的数据就是那些能够促使它们消灭上述腐败占比的数据。(披露:我投资了UrbanSterns。)

正如哈佛商学院的Ben Edelman所言,“浪费意味着机遇,”无论是在工业生产,零售还是法律调查中,找到被浪费掉的努力和资源的源头就意味着被引导至正确数据所在的方向。无论它(指正确数据)是简单如你有先见之明的预期(应该准备多少存货)还是(复杂到)需要你去思考那些隐藏在商业模型中的各类决策(夜间10点的出租车会如何在城市中选择揽客路线),搞清楚这些决策内容将会带你直指(产生)浪费的源头。

问题2: 你可以将哪些决策自动化以减少浪费?一旦你已经拥有了(固定的)决策,那么这个假设命题就变成了你能实际改变些什么(来减少浪费)。人类(大脑)在实施某些特定类型决策时往往表现优异。当需要决定怎样的宣传活动才能够激发出他人对品牌和营销材料最不理智的反应时。人类(大脑)是无以伦比的。因此这类决策权最好(至少现在)还是留在我们自己手里为好。

但对于简单,可重复,易操作的决策(朝哪儿派出一辆出租车,如何为一种产品定价,或是该为一家花店订购多少鲜花),机器就要比人类强得多了。即便在20世纪很多商业模型中这类决策仍由人类控制决断,时至今日,我们已经可以通过辨识数据并自动处理(指交给机器)的决策数量已经多到远远超乎你的想像了。

以亚马逊为例,传闻它已经裁撤了所有的定价团队,并把大多数的定价决策全权交予算法控制。对于大多数的零售商来说这可真是天杀的(举动)。然而一旦亚马逊的算法奏效了,它将意味着更少的折扣(促销)投入,更少的库存积压(产品),以及引进新产品时更优秀的(市场)预测— 无论哪一项都将带来不可估量的竞争优势。

问题3:你需要哪些数据来着手行动?一旦你对原有系统中的铺张浪费有所了解并且锁定了那些影响浪费的决策,最后一步要做的就是问自己一个简单的问题。如果你能获取任何一条信息,无论多么难以置信,使得你能够做出完美的规划,那么(这样的信息)会是什么?

以优步而论,它必须精确掌握所有潜在乘客在城市中的位置以便自动做出决定来协调周边区域,决定向何处派遣司机的同时协助人类司机(人脑)在寻找下一个机会时减少浪费(路程,时间等)。以通用电气的Predix工业互联网软件而论,公司亟需准确了解一台机器何时会故障停机,以便自动设定决策安排维修来访并减少因计划外故障造成的停工所带来的损失。以为了节省开支的健保公司而论,它们自然很想知道一个糖尿病人何时血糖会降至危险的程度,以此来自动决策出(恰当的)病患介入时机并降低因对疾病管理不周而造成的浪费。

(上述)这些即是应该被搜集的“正确数据”。如果你在“碾碎”(仔细分析)大量信息后能够最终发现它们,那自然是极好的,如果你能构建一个应用程序并直接察觉并获取它们,那就更好不过了。

大多数的公司都把太多的时间“献祭”在了“大数据”的神坛上。却很少花足够的时间去思考究竟什么才是真正需要被找到的“正确数据”。

END

版权声明:

转载文章均来自公开网络,仅供学习使用,不会用于任何商业用途,如果出处有误或侵犯到原作者权益,请与我们联系删除或授权事宜,联系邮箱:holly0801@163.com。转载大数据公众号文章请注明原文链接和作者,否则产生的任何版权纠纷与大数据无关。

原文发布于微信公众号 - 大数据(hzdashuju)

原文发表时间:2017-02-23

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏VRPinea

公开演讲恐惧症怎么破?不如试试这三款VR应用吧

3707
来自专栏Java学习网

8个让程序员追悔莫及的职业建议

8个让程序员追悔莫及的职业建议 正如老牌Faces乐队的经典老歌《Ooh La La》中的歌词一样“ I wish that I knew what I kno...

2838
来自专栏二进制文集

《游戏改变世界:游戏化如何让现实变得更美好》

现实世界没有办法像虚拟空间一样,轻轻松松就能让人享受到精心设计的快乐、惊险刺激的挑战以及强而有力的社交联系,它没有办法同样高效地激励我们。现实不是设计来最大限度...

1931
来自专栏大数据文摘

未来战争,军事大数据决定主动权

2955
来自专栏大数据文摘

清华数据院院长韩亦舜:大数据时代的数据伦理问题探究

2926
来自专栏鹅厂网事

腾讯NOC运营外包管理探索之路

"鹅厂网事"由深圳市腾讯计算机系统有限公司技术工程事业群网络平台部运营,我们希望与业界各位志同道合的伙伴交流切磋最新的网络、服务器行业动态信息,同时分享腾讯在网...

5258
来自专栏罗超频道

谁来掘金移动互联网时代的信息鸿沟?(下)

罗超为虎嗅网撰稿,2013年6月25日发表于首页 哪些产品、应用或者技术的机会? ——智能手机 中国的手机用户数近11.5亿户,网民却不到其一半的5.64亿。排...

3365
来自专栏镁客网

涅槃重生!VR社交平台Altspace宣布回归

1470
来自专栏Sign

东京玩具箱

『东京玩具箱』有两部,另一部叫『大东京玩具箱』,连起来是同一个故事。 这大概算是一部『上班族』漫画,就是游离于『青年漫画』和『成人漫画』的边缘的类型。 故事的主...

38016
来自专栏程序猿

BigData包含什么?

大约有那么两三年了,“互联网+”,“大数据”,“云计算”这些词语,出现在大众面前,这些词语还被政府官员和“创业者”们天天挂在嘴边,真是搞不懂,自己心里根...

36911

扫码关注云+社区

领取腾讯云代金券