前方高能“梗”很多,看那些大数据的猪在跑

文|邹欣,微软亚洲研究院研发经理 微博@程序员邹欣

最近几年来,市面上有不少关于大数据的宣传, 凡有饮水处,都能听到 “big data“, ”data driven decision making” 等等高大上的词汇。我在中关村街头看见有人在溜大数据的猪,也吃过大数据的猪肉,饱食终日,也想分享一些零碎的感想。

0. 大数据的好处

【此处略去 250 万字】

1. 古已有之。很多现在流行的道理,国人往往说古已有之。 “数据驱动决定”也不例外:

… …先诳之曰:“与若芧,朝三而暮四,足乎?”众狙皆起怒。俄而曰:“与若芧,朝四而暮三,足乎?”众狙皆伏而喜。—— 《列子》

虽然都是七个“茅”, 但是朝四暮三会导致用户爽, 那一定是有道理的!

2. 自己的数据和别人的数据

大部分人对自己的如雷鼾声听而不闻,倒是别处有什么小响动,就坐卧不宁,说影响自己休息。一些大公司里不少的经理经常发一些其他产品的成败分析,最新动向,谣言等等,但是自己产品的用户发邮件来抱怨,却没人处理。

3. 数据的可见性和成本

当我们谈大数据的时候, 很多人的第一反应是,希望看到更多的数据,甚至所有的数据,因为看到了所有的数据,就能做决定了。

例如,两个人在下陆战棋, 你不知道对方的具体兵力部署,的确不好做决定。 但是,要看到对方的数据,需要多少成本呢?你可以用连长,营长去实验,但是这样的实验是有成本的。

有时候自己人传递数据,处理数据也是有成本的,我们以前小伙伴们在学桥牌的时候,本来双方已经叫到4黑桃了,不料南方又叫了一个新花色 “5 草花”! 后来双方总结的时候,南说 “我想表达一下我的草花也挺好...” 表达是有成本的,这意味着双方又要为此在 5 阶上面寻找合适的定约,增加了许多没必要的风险,最后牌局打宕了。

(下图只是一个示意)

好,下面给你看所有的数据,这回所有的棋子都没有遮掩,双方的信息都是公开的。那么,这些数据展现了什么规律?下一步黑棋应该怎么走?

(这是最高等级的决赛,请读者慎重考虑。实战中,黑棋的下一手考虑了 2 小时 57 分钟,然后一招制敌。这位棋手的大脑在将近 3 小时的时间里收集了什么?计算了什么?)

4. 大数据和第一感

一叶落而知天下秋。 这是大数据么? 如果大数据的专家坐镇,要看到多少落叶,到什么时候才做出 “data driven” 的判断 — 秋天到了!

大数据,有人觉得大和纷乱,有人第一感就能看到问题的实质。例如 @winter 讲得故事:

5. 大数据、把握和时间

如果有时间,我们总是可以得到更多的数据。 有积极的员工提出新想法,建议在某一个局部先试验,当然这需要资源。 其他人反对说, 你有100% 的把握么? 哦,没有? 不然继续收集数据,等到有了我们再讨论。

等到有充分数据的时候,就是竞争对手已经占领市场,大势已定,各路专家都写文章分析它的成功经验的时候。 这时,你拿了数据给领导看。 领导说,嗯,有道理啊,当然,我们这个时候再进入这个市场显然已经太晚了。。。

篮球场上,有队员要投篮, 他的队友不是各自做好准备抢篮板,或者补位,而是问你, 你有100% 的把握投进么? 如果没有,那就传一会球吧,千万别 “风投”。。。 篮球比赛有24 秒的进攻时间限制。大公司往往没有这样的限制,在大公司工作的人可以永远头脑风暴,收集数据,分析数据, 把传球过去,别人又传过来,这样就能度过好几年。事实上,别人在市场上已经打了好几个来回了。

6. 记一次 SMART 的大数据项目

王屋村进驻了几个大数据专业的实习生,他们品尝了当地特产芝麻烧饼之后,都赞这些烧饼外焦里嫩,焦得金黄,带有芝麻的香味。 吃完好多烧饼之后,大家打着饱嗝,看着桌面上的芝麻粒儿,决定要对它进行大数据的剖析和改进。 首先,最容易数据化的,是芝麻粒儿。“最关键的,是要问出好问题”, 他们从课堂笔记中画重点的字句里抽出这句话,开始了一系列当地人从来没问过的问题:

  • 一个烧饼表面附着有多少个芝麻?
  • 当烧饼没有附着任何芝麻的时候,是不能叫“芝麻烧饼”的, 当烧饼的芝麻数到了N 个,用户就会说这是“芝麻烧饼”, 那么,N 是多少?
  • 数据小组的目标是:求出N,并优化。

他们从MBA 和大数据的教材中,论证了这个项目是SMART 的:

Specific: 针对一个具体的问题,避免过于宽泛的 – 王屋村新农业改革前景展望,等问题。

Measureable: 可以衡量的,而不是笼统的 “好吃”,“有嚼劲”。

Actionable: 可以具体操作的 – 增加或减少芝麻的数量,非常可操,操的过程可跟踪,可衡量。

Result: 有结果的,这个活动可以优化资源,减少芝麻的浪费。

Time: 有期限的,实习期三个月就要搞定。

他们看到这个项目是SMART 的,于是就报告领导,领导看到的确是SMART 的,就认为是好的。开始行动。 他们在三个月的时间内实验(吃)了各种芝麻量的烧饼,并采访用户,衡量用户味蕾打开程度,做广泛的用户调查,跟踪芝麻在消化系统的生命流程,等等。

最后,他们用Keynote 软件分享了他们的大数据芝麻烧饼的建议:

N = 7.5

只要七颗半芝麻,用户即认同这个烧饼是 “芝麻烧饼”。为何要有半粒芝麻? 因为大数据的平均值就是这样,同时,我们要做到极致,让用户看到烧饼上的半粒芝麻尖叫!

然后他们带着感恩的心,用技术了改变世界的的喜悦离开了王屋村,还打包了很多烧饼。

7. 大数据是手段还是目的

有些读者可能以为上面的例子太极端,其实在现实生活中,比这多彩的例子多了去了。 数据是我们的手段还是目的?

曾经有一个小软件,这个小软件可以出现在屏幕的不同位置,给用户带来一些价值,用户反馈还不错,但是还可以做更多的事情。后来产品组的PM们想通过各种实验来了解不同位置对用户的变化

  • 界面初始是隐藏的 | 不隐藏
  • 在任务栏中显示 | 不显示
  • 有时主动弹出窗口 | 永远不弹出

人们用常识就可以知道, 如果这个App 不断地出现在用户的视野中, 用户就会用得更多,但是也有用户会觉得烦,而卸载这个App。 但是好奇的PM们想知道究竟是多少,于是我们做了各种试验, 过了好几个月,好了, 我们知道了具体的百分比,的确是和常识差不多。

那现在怎么样呢?下一步怎么办?怎么赢得用户?

大家讨论了一会,没有什么办法,最后这个项目也不做了。 如果我们把做各种实验的时间花到给用户提供更多价值上面,是否会更好?

我们做软件的目的是赢得用户, 不服务这个目标的东西都是耍流氓!

8. 当你有很多数据,但是没有洞察力的时候

KK说 – 当你对互联网一无所知,却试图通过数据来弄懂互联网,那么你很自然地会得出结论:互联网是用来传输广告和黄色内容的。

9. 如何搞到数据

在一个平行世界中,亨利福特在研发汽车的时候,他去找当时的主流用户 — 马车夫 — 做大数据研究。

他和马车夫同吃同住同生活,他收集大量的数据,例如马粪。他在深夜和众多马车夫喝酒,开头脑风暴会议,分享了无数劳动人民的黄色笑话。 马车夫杰克的畅想深深地打动了他 – 如果马又能跑,又不会吃草,就好了。

10. 没有数据的地方

跟着数据跑,有这么大的错误么? 不至于吧?! 数据在哪里,公司的生意就在那里,这有错么?

这当然是有价值的,我在第 0 条就说了大数据的 250万字的好处。 你看小朋友们踢足球, 球在哪里,他们就聚集在哪里。 这至少给大家一种参与感。 那么职业的选手怎么踢球呢?

我们看看 98 年世界杯 荷兰 vs. 阿根廷的比赛

荷兰队球员弗兰克-德波尔开了一脚长传,他传球计划的落点上,没有自己的队友,也没有防守队员,那是一个没有数据的地方。 但是,当球落下的时候,自己的队友就到了。

他的队友博格坎普正跑向那个没有数据的地方(红衣服的那位):

现在人跑到了,球也到了,博格坎普一停,一晃,挑射。

守门员的手臂还在使劲伸展,三个刚刚到场的后卫在看着皮球入网,博格坎普的身影划出一阵红色的弧线,他开始庆祝了。

没有数据的地方,没有球的地方,往往是有机会的地方。

原文发布于微信公众号 - CSDN技术头条(CSDN_Tech)

原文发表时间:2015-07-01

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏量子位

机器爱人即将一统江湖,谁还稀罕过什么情人节

量子位 | 李林 舒石 发自 凹非寺 ? “人类有两大驱动力:对伟大的渴望和对性的渴望” —— 弗洛伊德 Valentine’s Day,原本只是西方基督教搞的...

37860
来自专栏即时通讯技术

一个野生程序员的真实自述:我是如何从数学专业学渣入坑程序员的

本文来自公众号“程序员loading”,原标题是“排除万难,我终于入了程序员的坑!”。

11120
来自专栏玉树芝兰

“低头族”学生为何要听你讲课?

去年,学校的教学区域Wifi全覆盖了。得知喜讯,老师们奔走相告——这下终于可以随时上校园网查资料了。

8310
来自专栏灯塔大数据

荐读|富有哲理的12条大数据金句 让你秒成大数据“砖家”

对《圣经》所有了解的朋友,可能会知道在《圣经》(启示录21章2节)中有个广为传颂的名言: ——看哪!上帝的帐幕在人间。他要与人同往,他们要作他的子民;上帝要亲自...

30640
来自专栏前沿技墅

苹果匠艺:乔布斯身边的天才

15740
来自专栏新智元

【机器人遛机器狗】波士顿动力对手Agility Robotics获得800万美元,“安卓之父”投资

【新智元导读】本周,机器人创业公司Agility Robotics获得800万美元A轮融资,“安卓之父”Andy Rubin创建的风投公司领投。Agility ...

37480
来自专栏数据派THU

520探讨一下如何给geek男友选礼物?(超实用)

一眨眼520就到了,又到情侣们互赠礼物秀恩爱的时刻了。女孩们总是嫌弃钢铁直男的蜜汁审美,送出的礼物总能让自己吐槽整整十分钟。事实上,如何给自己的geek男友挑到...

12540
来自专栏华章科技

自拍有风险!大数据在用什么姿势“出卖”你?

而就在几个月前,某ISIS成员在其“总部大楼”自拍,并且在社交网络上大肆吹嘘这里的指挥能力有多么“炸裂”。结果一语成谶,22小时之后,这幢大楼就被美军三枚导弹“...

11020
来自专栏钱塘大数据

清华才女飙泪谈人工智能:这才是我最大的担心!

随着AI时代的到来,“人工智能” “物联网”“云计算”这些看起来高度技术化的名词,正在走入“平常百姓家”。科技驱动未来,也许有不少人的想法,正如《南风窗》写的那...

35960
来自专栏玉树芝兰

创新怎么教?

创新能力不是从天上掉下来的,而是你本来就有,却被你忽略或者压抑的。因此它才可以通过有效的方式挖掘出来。

9630

扫码关注云+社区

领取腾讯云代金券