【涨姿势】绝不装逼的大数据科普(二)

言归正传,今天带来浅显易懂的大数据科普(二),会围绕一些大数据的关键概念重点普及一下,如果您已经很懂了也不要跑,本文可作为您的最佳厕所读物

数据(data)这个词,最早源于拉丁文,是“已知事实”的意思。关于这点昨天(一)已经欢乐地科普过了,回复{大数据}或者{big data}可以看到上一期的文章。

那么先甭管大不大,请问大家,数据的核心是什么呢?

答对啦!数据的核心是:一切皆可被量化

所以大数据不是大数字,光是数字那样就没有腔调了,大数据首先,就是把不被认为是数据甚至和数据不沾边的事物转化成了可被量化的有用信息,创造价值。(文科生们,一起喜大普奔!)

说到这里要表扬一下业界良心-谷歌,他们的数字化图书计划,就成功滴将人类书写文明的15%转化成了数字图书,这样,你不需要穿越个几次,就能通过搜索词找到公元15世纪以来的作品,并看到通过对这些文字的定量分析,揭示的人类行为和文化发展的趋势了。

这里先打住,虽然桑尼对人类文化变迁很有兴趣(写了根本停不下来),但从实用性的角度,还是先科普一下大数据的商业应用

大数据对于商业创造价值的最大意义,就是把每一个客户当成一个个体,通过他(她)制造的数据来进行精准客户洞察。

举一些(知名)客户的例子来帮助大家了解两种最重要的大数据类型-结构化与非结构化数据

结构化数据

客户案例1:桑尼潘在法国巴黎的香奈儿精品店完成了一笔购买交易。

(ps. 这张是真图,摄于我很年轻很年轻的时候。不过你们不准去人肉我哈,桑尼的钱都是自己的,不是红十字会的哦,别说干爹了,我亲爹都不会给我钱!)

购买完成后,该精品店就会通过联网的CRM系统,记录下桑尼这位客人的所有结构化数据。 交易中的结构化数据包括:

1.客人的一些基本信息: 性别:女 国籍:长的不象中国人的中国籍女子 年龄:不告诉你们 职业:外企打工妹 学历等等等等

2.交易及交易历史的基本信息 本次交易金额:XXXX油罗 历史交易次数:每年到巴黎买一次 购买最多的品类:菱格纹小羊皮包包 等等等等

通过这些结构化数据,桑尼就会被数据定义成一个香奈儿脑残粉,成为该品牌以后客户营销活动的一个重要参考依据。

非结构化数据

注意:这才是大数据的真正BIG点,也是让你从不懂大数据的小伙伴中脱颖而出的关键!

因为,非结构化的数据占到总数据的80%了呢。

如果说,结构化数据用详实的方式记录了企业的一切生产交易活动,那么非结构化数据则是掌握企业品牌建立和生死存亡的关键内容,其所反映的客户信息透露着许多企业提高效益的机会,是21世纪的兵家必争之地!

客户案例2:万达集团的公子王思聪(又称国民老公,祖母绿级王老五)在京东商城买了一个200块的电脑桌。

因为京东“店大欺客”送货慢了,王大公子发了这样一条微博-

然后发生什么事大家也能猜到了,由于王公子国民老公的定位,全国的“王太太团”疯狂吐槽,在微博上瞬间爆了京东。

这就是典型的承载于社交媒体的非结构化数据-用描述性语句表达人类的观点,喜好和愿望等等,千万不要小看它,一个不慎它就客大欺店给你看,分分钟颠覆一个苦心经营的品牌!

在王公子吐槽网购后没几天,万达就猛甩50亿宣布全面进军电商,你们说,这是不是个巧合?

补充说明1:非结构化数据还包括很多其他:文书、表格、声音、影片、图形等媒体内容。限于篇幅不一一举例了。 补充说明2:还有个半结构化数据,太难了先不恶心大家了。

补充说明3:还有个热门BIG词汇叫传感数据,什么意思?话说每个人的身边,是不是都有这样一个热爱跑步的小伙伴每天要晒类似下面这样的图呢?传感数据的应用商机无限哦,改天我再另起一篇和大家探讨。

以上,通过桑尼小姐和王大公子这两个好(mo)朋(sheng)友(ren)的联合案例说明,大数据的分类概念你有没有get到一点呢? 【名词解释】

BIG=逼格

有读者留言在问桑尼一直提到的BIG是什么意思?我就在等你们问啊谢谢啊!

关于逼格这个词,顾名思义就是装逼的格调

看到这里有人肯定要拆冷鸡(challenge)我,桑尼你怎么一会儿写不装逼科普,一会儿要大家提升逼格,你精分的有点严重呢。

当然不是啦,逼格和装逼是不一样的哦少年~

你有了逼格,代表你有了装逼的能力,至于装不装,看你心情和场合。

人性的一大特点,就是喜欢凸显自己的优越感,满足虚荣心不是吗?所以“装逼“本身,没有什么可耻的。

装逼最大的风险,就是碰到逼格比你更高的人被打败,所以啦,大家一定要好好学习,多关注我,才能不断提升自己在逼格界的等级,在任何场合立于不败之地。

我们的目标是!提升逼格,谨慎装逼。

皮埃斯:其实我的订阅用户里有不少现实生活中的仰慕者的。。但是看完这段粗话脏话估计他们对我也不会有任何遐想了。。。唉牺牲好大!

原文发布于微信公众号 - PPV课数据科学社区(ppvke123)

原文发表时间:2014-08-25

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏人工智能头条

香港中文大学张胜誉:个性化推荐和资源分配在金融和经济中的应用 | CCAI 演讲实录

12510
来自专栏PPV课数据科学社区

【资源】超赞的交互式数据可视化网站

根据国际数据公司(IDC)的估算,到2015年,全球的数据增长率将会是2012年的两倍,年数据量将达到5.6泽字节(1ZB = 1024的3次方 TB)。那将会...

59850
来自专栏CDA数据分析师

【Big Data】如何修炼成大数据高手?推荐你看这些书

首先声明一点,千万不要以为看了这篇文章就能成为大数据高手了,不然就不会用“修炼”这个词了,要修炼成大数据高手决不是件容易的事,可以说是非常难的一件事。要不也不会...

211100
来自专栏PPV课数据科学社区

盘点国外社交网络:大数据意义究竟何在?

“别说忙,没工夫看书。。。你那刷FB/朋友圈的工夫腾出来,保证每周啃下一本”,小编身边总充斥着这样的‘训话’。。。 额,奈何我每天的工作离不开从社交媒体中获取信...

42960
来自专栏大数据文摘

[译]综合2000个招聘经理的建议后,给出33个面试关键提示

15020
来自专栏iOSDevLog

《超级智能》书评

2017年的此刻,你和世界上的大多数人一样,坐在办公桌前拼命完成上级布置的工作任务,或是无聊地刷着网页打发时间等待下班。你焦虑于本周的工作能否按时做完,公司的年...

9810
来自专栏大数据文摘

在大数据的世界中蓬勃发展

16050
来自专栏大数据文摘

数据思维从娃娃抓起,利用体育运动分析讲解数学

15250
来自专栏大数据文摘

数学恐惧症?不会睡着的数学书了解一下!

14460
来自专栏大数据挖掘DT机器学习

评《大数据时代》一点笔记和一些琐碎的感想

《大数据时代》是国外大数据研究的先河之作,本书作者维克托•迈尔•舍恩伯格被誉为“大数据商业应用第一人”,拥有在哈佛大学、牛津大学、耶鲁大学和新加坡国立大学等...

39460

扫码关注云+社区

领取腾讯云代金券