专栏首页大数据文摘车品觉——数据的本质就是还原

车品觉——数据的本质就是还原

当我们在进行用户的场景还原时,必须认清数据收集的领域是什么。在不同的领域里收集到的数据,可以找到与其所在领域里不同的东西,比如,搜索引擎和社交网络(SNS)得到的数据就是不一样的。而企业首先要做的是,确认用户是不是同一个人,比如在SNS里涉及的很多信息主要都是聊天内容,如果我是做 SNS 的,我就会更多地去寻找这个人和其他人的关系。他今天跟张三聊了 3 分钟,明天跟李四聊了 5 分钟,这项数据在 SNS 领域里可以获得。但当我们要真实地还原整个人的行为的话,最好要有不同领域作为互补,这会让你掌握更多更全面的信息。

你有多大的能力知道哪些数据是同一个用户的,这是企业首先必须解决的问题。然后再去关注,收集到的数据的量这么大,广度这么 宽,价值在哪里。而当企业不清楚收集到的数据是不是同一个用户的时,那这个数据又有什么用?所以,在大数据里,最重要的还是收集人的数据。

而数据的价值,正如我们前面所分析的,必须来自场景。

对于消费者数据的收集,其中一个瞄准器就是你能否还原用户购买行为的场景。基于科技的不断进步,如果有一天 Google  眼镜成为每个人的标配,或者是有一天,我们买的每一部电脑,其本身都是跟手机捆绑的,那么这两种交叉数据是很容易获取的。

为什么场景会变得如此重要?场景是不是被准确地表达了?场景是否会成为一件事情的背景,用来还原整件事情?有一年的“十一黄金周”,我们发现很多用户使用 iPad 购物,为什么?你或许不会想到,这是因为那年的“十一黄金周”第一次实行黄金周高速公路不收过路费的政策,很多人堵在了路上,没有其他事情做,所只能以使用 iPad 购物。如果企业在分析数据的时候,没有考虑到 10月1日整个中国的高速公路都出现拥堵的这个场景,企业就没有办法还原整个场景,也就无法解释这个现象。

我还发现了一个新场景。有一天,我们研究了一些无线数据——用二维码让用户到 达我们预想让他到达的页面。我们可以看到,iPhone 手机在扫完二维码后就到达了页面,但是安卓却没有。在中国,很多装有安卓系统的手机在扫完二维码之后都无法自动跳转到关联页面。这时,安卓手机就成为用户登陆网站购物的重要场景。不管是一部 iPhone 手机、一部三星手机,还是一部其他类型的手机,手机的大小和系统的兼容性本身都能对场景产生巨大的影响。而如果我们盲目地去观察数据本身,自以为是地认为用户没有进行点击,那就大错特错了。事实上,是他点不了。

可见,有很多看似无关紧要的东西都在场景里,而在无线移动终端的世界里,这个场景又平添了很多其他的东西,这都需要我们仔细地甄别。

当我和数据分析师们聊天时,我总是会特别提醒,在研究无线数据的时候,要特别注意的是用户在每天移动的时间点和非移动的时间点里都做了什么。从起床到睡觉,有几个时间点基本是固定的,所以基本上就可以判断每个人一天的行为走势是什么。

我曾经在一次电商大会的圆桌论坛上提出了一个观点,当时与会者都很认同,就是我建议把一些以前用来观察用户忠诚度的框架,比如 RFM 模型来做收集数据的瞄准器。有什么数据能让我更好地看到 R,更好地看到 F,更好地看到 M ? RFM 是一个收集维度,个人 PC、手机、平板电脑是另一个终端场景维度,PC 能更好地收集 R,手机能更好地收集 M,这样就可以通过场景的不断变换来收集更多的数据。

现在,有一些终端的确可以收集以前收集不到的数据。以前,我们不知道一些数据的收集背景是不是移动的,但现在可以。用户做一件事情的时候是不是正在移动?他是不是在银泰百货里面?面对不同的场景,我们的框架也要相应改变。所以,现在做数据分析报告,最后的一个问题变成了:“无线变了,这个报告的结果还是一样吗?你的报告应不应该也变一下?”

我认为,数据的本质就是还原,这是收集元数据的关键方法。如果没有这个概念,你就不知道未来你需要什么数据,就更不懂得什么是重要的数据,到最后只会产生越来越多的无从辨别的数据。一旦数据多到了连你的公司都没有办法处理的时候,那么其他会处理的人、公司和国家就会把你毫不留情地挤出市场。

“未来一定是国家和国家之间的数据大战,公司与公司之间的数据大战!”信息时代催生了海量数据的出现,这个世界上每时每刻都在产生大量的数据。此时,大数据已经不再是一个单纯的概念,而是像空气一样围绕在每个人的身边,每个人都是数据的制造者。也正是因为每个人都在通过不同的设备生产着数据,使得数据更多在“量”这个维度上不断膨胀,但是,“量”的单纯膨胀却对企业真正了解一个用户的需求产生了极大的挑战。所以,如何更好地识别各个设备的使用者是否为同一个人,如何更好地理解用户在各个不同场景下表现出来的不同需求,如何更好地理解数据融合后产生的价值,将是未来商业中每一个企业都必须考虑的问题。

在不久的将来,随着 O2O的深入和穿戴式设备的兴起,企业和企业之间必须进行更多的数据融合和交换,必须进行更多的跨行业的数据交流,这样才能更好地还原用户真正的需求,让用户在任何一个场景中都能够获得由数据带来的便利。

总而言之,更深化的数据连接使海量数据经过提炼更真实地还原了事实,也使我们运用数据科技去解码未来的需求成为可能。

本文分享自微信公众号 - 大数据文摘(BigDataDigest)

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2014-04-13

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 论一个CDO的自我修养:神秘的首席数据官究竟有哪些操作

    大数据文摘
  • CRA简报:计算研究与数据科学的新兴领域

    大数据文摘
  • 小数据更管用!

    大数据文摘
  • 360大数据中心副总经理傅志华:企业如何有效的实施大数据战略(内附PPT)

    数据猿导读 在人工智能和大数据技术在实施过程中你可能会陷入三个误区:业务部门没有清晰的大数据需求和规划;企业内部数据孤岛非常严重;组织架构未能有效支撑大数据实施...

    数据猿
  • AI时代就业指南:大数据工程师到底应该会什么?

    大数据领域包含哪些职位? 在大数据行业中有很多领域。通常来说它们可以被分为两类: 大数据工程 大数据分析 这两个领域互相独立又互相关联。 数据工程涉及平台和数据...

    小莹莹
  • 医学+数据科学,必将大有可为 | 清华生物医学影像研究中心赵锡海

    在数据时代,相比于传统的统计学分析方法,使用数据科学领域的算法模型或图像识别等技术将能辅助医学专家提高医学研究效率和精准度。作为从始至终支持数据院在医疗健康大数...

    数据派THU
  • 研究大数据不一定非要用自己的数据,我国政务大数据共享发展任重道远 | 大咖周语录

    国务院《促进大数据发展行动纲要》提到,推动政府信息系统和公共数据的互联共享,避免重复建设和数据打架,增强政府的公信力,促进社会信用体系建设。政府开放数据需要技术...

    数据猿
  • 91科技集团董事长许泽玮:5G时代下,大数据将是技术红利释放的第一高地丨金猿人物展

    本文由许泽玮撰写并投递数据猿参与评选,更多关于【金猿榜/奖·2019征集评选】的相关信息,请点击这里了解详情丨征案例、征文章、征产品=评企业、评人物、评产品。

    数据猿
  • 睿码科技执行董事王海婷:大数据在治理雾霾方面有很多事可做

    数据猿导读 国内的研究机构认为,2018年我国大数据市场规模将超过 1500 亿元,但是目前大数据与环保相结合的还是少数。本文中,睿码科技执行董事王海婷将给大家...

    数据猿
  • 通过4部美剧教你看懂大数据

    美剧你爱追么?这些美剧你看过么?这些美剧和大数据有联系你知道么? 什么?你不知道?学统计的怎么能不知道?难道一直做题目不枯燥么?有空看看这些吧,在娱乐中学习,...

    小莹莹

扫码关注云+社区

领取腾讯云代金券