大数据的核心价值到底是什么?

作者:王喆 链接:https://www.zhihu.com/question/23273263/answer/65433220

先说结论:大数据的终极核心价值在于“资源优化配置”。

无论是大数据在农业的应用也好,工业的应用也好,抑或是在金融行业的应用也好,最终都是通过大数据技术来获知事情发展的真相,最终利用这个“真相”来更加合理的配置资源。

具体来说,要实现大数据的核心价值,还需要前两个重要的步骤,第一步是通过“众包”的形式收集海量数据,第二步是通过大数据的技术途径进行“全量数据挖掘”,最后利用分析结果进行“资源优化配置”。

只说概念大家肯定没法直观的理解上面的观点,那就将几个咱们都接触过的例子讲一讲大数据是怎么通过这三步发挥核心价值的?

第一步、通过“众包”产生和收集数据

高德地图、百度地图都有实时路况的功能,但大家有没有想过实时路况的数据是怎么收集的?实际上经过了三个阶段,开始是跟交通口的一些公司合作,获取交通流量监测设备的数据,这个方法缺陷很明显,一个是受制于人,一个是想扩大监测范围就要部署大量设备,费时费力,而且还受法律制约。于是一些专门做路况的公司开始用出租车当浮动车收集数据。但这种办法还是无法覆盖大量的大小路段,随着移动互联网的普及,高德地图的APP能够实时上传大量机动车的速度和位置信息,经过去噪和综合分析,就形成了覆盖率极高的实时路况信息。这就是一个典型的“众包”过程。

严谨一点来说,众包指的是一个公司或机构把过去由员工执行的工作任务,以自由自愿的形式外包给非特定的(而且通常是大型的)大众网络的做法

大数据的“海量数据”就是由“众包”产生的。广义上,用户的行为数据,各种传感器的数据,也都是“众包”的形式,只要是由过去集中式的产生模式扩散到分布式的模式,都是众包的形式。

第二步、通过“全量数据挖掘”获知“真相”

曾经看过一个视频,通过分析阿里巴巴全年的数据得到的阿里巴巴的世界贸易与全国贸易的趋势。视频中体现的不仅是阿里巴巴集团的运营情况,其实也部分反映了整个中国的经济运行情况。而且这些数据不是通过采样得来的,就是真真切切的“全量数据”。我们再也不用通过“管中窥豹”的形式来推测全局,而是直接通过“上帝视角”来窥视真相。这就是大数据的魅力,我们获得了前所未有的获取真相的能力,而且对于大型互联网公司来说,即使是PB级别的数据分析也是准实时的,我们下一个小时就能够得知上一个小时的全量数据分析结果,这样的能力是前所未有的。

第三步 大数据的核心价值——“资源优化配置”

前段时间,滴滴打车曾通过投票和订单分析的方式得出了北上广深四地的加班大楼排行榜,敝司不幸排名第三,但事实真的是即使加班很晚也很难打到车啊啊!所以滴滴打车更名为“滴滴出行”之后,也抛出了他们伟大的愿景,那就是利用大数据分析实时综合调度“快车”、“专车”、“出租车”、“顺风车”甚至是滴滴巴士的资源,实现全局的交通资源优化。事实也是如此,滴滴的司机们越来越多的需要完成“指派任务”,而不是集中去抢高净值客户。也许对于个别单体来说他们的利益降低了,但全局的资源配置却避免了全局的资源浪费和过度竞争,无疑大大提高了交通资源的使用效率。

所以我们说,基于大数据分析的结果,进行资源优化配置,才是大数据应用的落地点和真正价值。

而“资源优化配置”的价值,又远远超出我们能够想象的层面,在资本寒冬即将来临的大背景下,利用大数据实现资源的高效利用,显得更加重要。广告行业利用DMP、DSP进行广告的精准投放,房地产行业利用大数据分析价值洼地,宜信利用大数据建设征信系统降低坏账率,券商陆续推出大数据基金,全部都是广义的“资源优化配置”的体现。大数据也远远不再停留在学术和“分析现象”的阶段,而是在各行各业实现了落地并发挥着非常非常重要的价值。

我是在互联网广告行业从事程序化购买系统建设的,而这个行业也是大数据最先发挥价值的地方。举个最简单的例子来说明大数据在广告资源优化配置上的作用。 宝洁集团是我们的客户,而宝洁的产品有非常强的用户性别倾向性,护舒宝的广告就应该投给女性,投给男性就是赤裸裸的浪费。而吉列的目标用户就只是男性。之前保洁集团是怎么做广告的?就是海投品牌广告,不分性别的海投,那这个做法在投放之前就已经确切无疑的知道有一半广告费用时浪费的。但没有办法,因为我们没有大数据技术来发掘用户的性别。

而随着DMP(Data Management Platform)技术的不断成熟,越来越多的广告主建立起自己的用户数据中心,可以不断积累客户的各种用户行为,进而判断出用户的性别,再通过DSP(Demand Side Platform)系统定向投放,最终可以为宝洁节省一半的广告预算。

上面的例子正是广告资源的优化配置,事实上DMP系统对用户画像的构建精确程度远超人们的想象,精准投放的各类筛选条件也越来越精细。现在微信支持精确到设备的精准投放,也就是未来完全可能实现精确到每个人终端的精准投放,这都依赖于大数据对于用户行为的挖掘,最终实现整个广告行业的效果提升。

很多同学可能会说大数据的核心是数据挖掘,是分布式存储,是NLP,是深度学习,但这一切其实只是大数据的技术途径,大数据的终极核心价值就在于“资源优化配置”。

原文发布于微信公众号 - 马哥Linux运维(magedu-Linux)

原文发表时间:2017-05-17

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏软件测试经验与教训

怎么让研发做好他们不重视但是对测试很重要的事情?

37680
来自专栏微信终端开发团队的专栏

今天不讲技术的事情了,讲个最近让我有些纠结的事

49460
来自专栏PPV课数据科学社区

如何从一开始就设计好数据分析的基本框架

【引子】 Porterfield的最新创业项目是Looker,一个商业数据分析解决方案提供商。主人公在下面这篇文章中向我们讲解创业者们如何可以从一开始就设计好数...

32170
来自专栏机器人网

逆天了!机器人学会“读心术”,仅靠意念就能控制

机器人产业日益发展,如今人们有多种方式操控机器人,比如给机器人编写程序,或是利用触摸屏,或是一个操纵杆。通过人工智能和机器学习技术,机器人也能够学会新的本领。 ...

35450
来自专栏互联网数据官iCDO

商业智能工具DOMO优势解读

DOMO为身处快节奏、竞争激烈的全球市场的大型企业提供商业智能(BI)解决方案。跨公司部门的用户可以直接基于Web使用该平台,无需昂贵、费时的部署策略。超过30...

44830
来自专栏VRPinea

浮于真实场景的照片分享,Bublar推AR社交移动应用Placie

38270
来自专栏镁客网

以虚拟现实骨灰级开发者视角,来看VR智能硬件平台

16440
来自专栏WeTest质量开放平台团队的专栏

腾讯WeTest助力游戏不再负重安全压力

根据CNNIC第42次《中国互联网络发展状况》调查显示,截至2018年5月,我国市场上监测到的游戏类移动应用程序数量为152万,避开版号审批等问题不谈,总量依然...

11120
来自专栏PPV课数据科学社区

【推荐】更多数据……巨多数据……大数据!

如果你所在的企业正在利用大数据支撑运营型分析工作,本章讲的正是这时你需要掌握和了解的那些关乎大数据的重要趋势。过去的许多年间,企业积累的数据越来越多。尤其是到了...

30660
来自专栏非著名程序员

中国独立开发者项目列表大集合-- 分享大家都在做什么?

最近一直在忙项目,在解决项目中的问题,带新人,忙的不可开交。就在这时,突然有一个读者朋友,在微信中扔给我一个了链接,问我:

13330

扫码关注云+社区

领取腾讯云代金券