【思维】如何把“数据”转化成可以行动的“信息”

题目中的这个问题,我理解是个本质。在数据时代,数据不管从哪里获取、用什么工具获取,也不管数据规模是否够得上是“大数据”,也不管你用来分析和利用这些数据的是BI软件(商业智能软件)还是数字化营销软件如AOS系统(注:美国安客诚公司推出的“受众运营系统”),你总得回答一个关键问题:面对一堆数据,你能去做什么,而且这个“做什么”是有效能变成真金白银的收益的。

所以,当我看到Mike Rozlog最新于2014/2/3发布的一篇文章中用到这个标题时,引起了我的兴趣。把文中一些主要观点编译概述如下,供朋友们参考,其中也穿插了我的一些理解、注解、举例。

作者首先指出“数据”在空前增长,人们在提供着信息,情愿地或无心地,通过社交媒体或者其他终端。作者描述了自己在FACEBOOK的情况,他居然不知不觉地、日积月累地在FACEBOOK那里列举出了他自己喜欢的160张音乐专辑,这就是“无心”中在提供数据,不想不知道,一想自己也吓一跳。

其实中国国内的朋友应该也有这个体会,当你在淘宝天猫购物时,有没有注意到在购物车结算价格时,有一个“是否匿名购买”的选项,很多人没有费力去勾选一下,那么也就是愿意实名购买了,那么你便“无心”也是“情愿”地提供了一条关于“何时、您、多少价格、网购了什么物品、怎么支付的、选择的哪种物流方式、联系电话和物流地址”的非常详细的信息。淘宝和天猫这个小细节在于把什么作为“缺省项”,如果把“是否实名购买”作为一个勾选项,把“匿名购买”作为缺省选择,估计也是大多数人“不作为”、不会去勾选,而这种“匿名购买”对淘宝的大数据战略无益,因此,对“是否匿名购买”的勾选项的“不作为”,就日积月累地“作为”了很多事情了。

但这只是日益增长的“数据”。作者认为,“数据”和“信息”是不同的,不同的关键在于“数据之间的连接(links)”。(注:我们这里不翻译为“链接”,以避免读者一下子就想到是网络阅读时去点一下链接的那个“超文本链接”)。这个“连接”强调的是数据之间的“关系”。数据本身是一堆原材料,类似数字、单词、计数、字串、图片、视频、音乐,哪怕他们被存储在“关系数据库”中,他们也天然地彼此之间没有关系,除非人去赋予他们关系。

而这种人为去赋予数据之间的“关系”,就是在建立数据之间的“连接”。如果一组或一连串的“连接”是正确的,那么数据就生成了“信息”,那么就可以基于“信息”做出一些假设/判断,从而去开展行动。如果“连接”错了呢,那么就可能相应地引发错误的行动。

比如下面这个例子,关于美国上个世界40年代早期对脊髓灰质炎(我们俗称的“小儿麻痹症”)的病因的研究。“原始数据”显示时入夏日天气渐暖时,病例增加。戏谑的是,“原始数据”还显示,当脊髓灰质炎的病例增加时,冰激凌销量也以同比例在增长。1952年美国有将近58000人(很多是孩子)被诊断得上了脊髓灰质炎,一场全国性的大流行病。公共卫生部门的专家于是建议要避免食用冰激凌、糖水和其他高糖食物。今天回头看历史,认为冰激凌是病因的想法当然很可笑,但那时候的确是“急病乱投医”了。

结合我们今天的情况来看,我们怎么把海量的信息转变成能带来行动的有用的信息、做出更好的决策而不是上例呢?我们已经有了一些数据采集的技术,也有了指数级增长的比以前多得多的数据,但我们还是没有生成好信息的那个神秘酱料。例如,当你看到以下常见的两列数据:

客户数据(姓名、街道、城市、省份、邮编、年龄、数据来源)

销售数据(商品编号、数量、成本、售价、日期、开票)

读到本文的朋友对上面的数据列都是非常熟悉的,也许还有更多列更丰富的信息。而关键的问题是,你面对这些数据列,你能问出什么问题呢?…肯定读者们能列举出一串经典的问题…但很有可能,漏掉了问那个有关键意义的一个问题。

Mike Rozlog指出说,实际上,应该再问一个“目前的数据尚不能支持的问题”,即“为了回答我真正关心的问题,我还缺哪些数据呢”?这就是“数据增补”的概念(Data Augmentation)。想一想,你可能关心的问题是“什么样的人是我生意的典型客户?”“我的下一个店铺应该选址在哪里?”“应该增加一种新产品系列的销售吗?”我们发现,目前的“客户数据”和“销售数据”无法回答这些,只有当增补了“MAP GIS”(地图地理信息系统)和“Census Data”(人口统计数据)”之后,才能做的更好。前者包括位置地点、路线、实际位移折线图等,或者包括邮编、平均收入、孩子的个数、种群种族等信息。这时,当你再问“什么样的人是我生意的典型客户?”这个问题时,客户数据、销售数据和人口统计数据建立连接,才能产生有效的“信息”作为答案。当你再问“我的下一个店铺应该选址在哪里?”,客户数据、销售数据和GIS数据建立连接,才能产生有效的“信息”作为答案。当你再问“应该增加一种新产品系列的销售吗?”,目前的数据可能又不够了,但是通过“数据增补”,现在我们找到了一个回答问题的办法,即找到“回答这个问题还需要去连接什么数据”,这又回到与生意主对“典型客户”的认知有关,你作为生意主,你有关于你“典型客户”的数据吗,如果是,那么就可以把新产品的试销量与典型客户相关数据进行匹配,看是否该新产品会进入典型客户的购物篮子。而在过去,对“什么样的人是我生意的典型客户?”“我的下一个店铺应该选址在哪里?”“应该增加一种新产品系列的销售吗?”所有这些问题的回答,往往靠直觉的猜想。

数据就在那儿,正在被采集、正在被分析、正在被汇总。但是,在数据被真正应用之前,最关键的一个事情,是问出你的现有数据无法回答的问题,即“缺失哪些数据”以及“缺失哪些数据之间的有效连接”。这里无法依靠魔法棒或者一个标准的问题列表,每一组数据当它被采集和呈现时,也就有了他特有的局限,即“还缺少什么”那个需要探索的世界。

回到作者篇头曾列举的问题,他的FACEBOOK上已经有了大量数据,关于他听什么音乐、他去什么音乐会,连他支付的平均票价都可以知道。但他是否会在音乐会上再开销一笔钱买相应音乐主题的T恤衫和帽子呢?不知道,GOOGLE也许知道,这时就需要增补来自GOOGLE的信息,一个人大量无心的在GOOGLE上的关键词检索,已经让GOOGLE可能比这个人自己还了解他自己。GOOGLE的前CEO, Eric Schmidt说,“我们知道你在哪里,我们知道你曾去过哪里,我们多多少少知道你在想什么”。

作者最后抛出几个问题,很耐人思考。如果某个信息来源有着关于你自己的而你自己还不洞察的信息,你会愿意付费吗?这些由数据而生成的信息会产生生意上的产出吗,还是这些信息会导致那个经典的小儿麻痹症案例中“相关关系”与“因果关系”的错判?这些都是我们从“数据”到“信息”到“行动”路上要探索的问题。

我自己编译并穿插注解举例到了这里,也更理解了AMT的伙伴美国安客诚公司AOS系统的关键,不仅仅在于数据本身,而是数据与数据之间的“连接”,以及他们长时间服务于各行业做精准营销的洞察与经验。这些经验沉淀为一个个模型,比如“谁是我的典型客户”,还可以转变为一个个专门的营销行动(campaign),比如“如何打通线上数据库和线下数据库的整合,找到我的高潜力客户(look-like)并有效促使他们下单”,还可以转变为一个个长期例行的职能工作(operation),比如“对于已经成为会员的客户,我们本年度应该如何开展会员营销和个性化服务”,最后,到一个个量化的绩效,“我对这批会员样本开展的营销活动,是否取得了和对比组相比之下超出5-8倍的效果(客单价、人均带来收入、人均带来利润等)”

“数据”、“信息”、“行动”、“效果”,然后再反馈,这样一个动态的过程,看来对于中国企业的大数据管理、营销精准化,正有很多的事情可以去做。

原文发布于微信公众号 - CDA数据分析师(cdacdacda)

原文发表时间:2014-02-10

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏PHP在线

程序员的未来

原文出处: tcz.hu 译文出处:码农网 – 小峰 程序员是注定灭绝的一个物种。 在一个来自于CGP Grey很精彩的视频中,他提出说,在不久的将来,...

2814
来自专栏企鹅号快讯

微软Everyday AI发布会:四大工具把AI带到你身边

昨天,微软在旧金山举办了一场“Everyday AI”发布会,会上主要发布了必应搜索引擎、微软小娜、Office 365和Seeing AI四种工具和服务的更新...

3708
来自专栏不二小段

零基础向:为什么要学习编程&如何入门编程

今天本来没有更新,结果收到了微信邀请开通原创和赞赏,遂赶工一篇文章。 这篇文章回答以下几个问题: 我们为什么要学习编程? 非计算机学生,如何对编程产生兴趣? 零...

29410
来自专栏大数据钻研

优秀程序员必备的15大技能

1.分享 尽可能地使用开源,并且如果有能力的话也可以把自己的成果分享给大家。整个社会的智慧结晶肯定比一些大公司自管自闭门造车要好。 2.公平的心态 不要以为你的...

3059
来自专栏新智元

【深度】摩尔定律的黄昏,十大方向带来计算行业的黎明 | 新智元出品

摩尔定律支配了计算领域 44 年的时间,今年终于宣告终结。在这之后计算领域会发生什么事?得益于半导体和芯片技术而高度繁荣的手机、PC 产业,会受到怎样的影...

3825
来自专栏大数据挖掘DT机器学习

腾讯,百度,阿里面试经验

腾讯面经 本人IT屌丝一枚,毕业4年,5年经验(大四在腾讯实习一年,实习生工资,工作内容同正式员工一样)。非常幸运,先后收到过腾讯、百度和阿里的offe...

1.2K4
来自专栏Java学习网

从 .NET 和 Java 之争谈 IT 行业

一、有些事情难以回头 开篇我先表明自己的立场:同时使用 .Net 和 JAVA,但更加偏爱.Net。原因很简单: .Net语言更具开放性,从开源协议和规范可以...

2378
来自专栏程序员互动联盟

一个程序员的奋斗历程

也许,你还为你的未来感到迷茫,也许,你还对程序员的历程感到神奇.就让我们来看看这位程序员的奋斗历程好了. 这些日子我一直在写一个实时操作系统内核,已有小成了,...

4018
来自专栏互联网杂技

走进交互设计——感受生活中的交互设计

交互设计(英文Interaction Design, 缩写IXD),是定义、设计人造系统的行为的设计领域,它定义了两个或多个互动的个体之间交流的内容和结构,使之...

5798
来自专栏PHP在线

程序员鸭梨为什么这么大

一: 任务多,精神紧绷 调研发现86%的程序员认为“近1~2 年压力越来越大”,还有一部分程序员表示“因为工作太多,情绪总处于紧绷状态,所以精...

3688

扫码关注云+社区

领取腾讯云代金券