专栏首页腾讯大数据的专栏大数据奇葩说:盘点10个有趣的大数据

大数据奇葩说:盘点10个有趣的大数据

大数据早已成了我们耳熟能详的词汇,大数据也逐渐得到的政府,企业和个人的重视。基于此,大数据究竟在如何影响着我们的生活?

大数据(Big data)

因为他,我们的生活是否变得更舒适?亦或,从此我们的生活细节都要暴露在数据的分析之下?我们该如何正确认识大数据?现在,先让我们了解一些真实的大数据的例子。

从地球到月球的距离

如果我们将一天内产生的数据全部烧录进DVD光碟内,那这些光碟叠起来可以搭成地表到月球的DVD高塔,而且还是双塔。

大数据与星星

根据IDC的分析,2008年时数码数据量就超过了目前已知的宇宙内星星数量,而且以数据成长的速度,2023年时全球数据量将会超过亚佛加厥常数(Avogadro's number)--也就是6.022×10^23。

亚佛加厥常数

男性内裤销量反映经济形势

已故美联储前主席格林斯潘(Alan Greenspan)曾提出过一个著名的"男性内裤销量反映经济形势"的理论。即经济形势良好,内裤销量会平稳上升,反之则下降。

原因很简单,经济萧条时,男性会节俭开支,少买内裤。。。

啤酒与尿布

这是个经典的商场数据分析案例。在上世纪90年代,美国沃尔玛的超市管理人员分析销售数据时发现了一个令人难于理解的现象:在某些特定的情况下,"啤酒"与"尿布"两件看上去毫无关系的商品会经常出现在同一个购物篮中。

啤酒与尿布

在美国有婴儿的家庭中,一般是母亲在家中照看婴儿,年轻的父亲前去超市购买尿布。父亲在购买尿布的同时,往往会顺便为自己购买啤酒,这样就会出现啤酒与尿布这两件看上去不相干的商品经常会出现在同一个购物篮的现象。

女性头发与经济波动

据日本最大日用品制造公司"花王",于1987年开始在东京银座对1000名,二十至三十岁女性进行的年度民调后汇编的"发型统计"显示,他们偏好蓄长发时显示经济在复苏中,反之则经济仍在恶化。

比如,1997年,留短发的比蓄长发的人多,那年为日本经济"最差"的一年,2008年经济有所起色,超过八成受访女性头发都很长。

手纸与肥皂

双十一海报

前年“双十一”(11.11)这一天,京东商城卖出了80万块香皂,重量约115吨,相当于23头大象;基情无限的同时,手纸卖出900万卷,8亿多抽手纸,按一秒钟扯一抽的话,至少要扯3年,按一卷纸30米算,900万卷至少可绕地球7圈。

处女座与小龙虾

根据"首届小龙虾美食节"的"小云WiFi美食大数据"显示,女性对美食喜欢程度超过男性,66%的女性喜欢吃小龙虾;而在年龄统计中发现,20-25岁的美食达人最多,处女座是所有星座中最爱食用小龙虾的人群。

一位美食大V不无严肃的认为,从一个侧面说明现在商家的小龙虾的制作工艺、烹饪方式已经达到了一定的高水准,"毕竟处女座的追毛求疵的性格是不争的事实"。

女服务员与股市

在这个刷脸的时代,容貌早已成了求职的隐形标准(不过凤姐当上凤凰客户端主笔,理当另说)。据纽约观察员的解读,当美艳的女服务员随店可见时,经济必陷困境,反之则显示经济兴旺,换句话说,当你到处碰见美女服务员,便可考虑抛售股票。

服务员与股市

该观察员的解释是,当经济红火,颇有点"资本"的女性很容易找到工作环境舒适的工作,诸如商品模特、推销员等。此外,男性经济宽裕后也更容易"金屋藏娇"。

大数据遇到爱情

美国波士顿数学家克里斯·麦金利(Chris McKinlay)注册一个婚恋网站后,认为他们的配对模式不合适,于是他自己写程序,只花了不到90天时间就在茫茫人海中找到了心仪的对象。

这位克里斯开设了12个账户,利用计算机程序随意作答网站的配对问卷,从2万名用户中收集到600万条问题的答案,然后利用演算程序筛选出5000名住在美国的活跃用户,从中按性格分类又选出最符合择偶条件的2组女子。

之后克里斯又创建了两个账号,诚实地回答这两类姑娘们最关注的500个问题。回答完问题后,他发现和自己匹配度在90%以上的超过10000人,最高匹配度达到了99%。

克里斯·麦金利

为了获得这些姑娘们的关注。克里斯编了一个新程序,自动访问与他匹配度高的对象,对方回访他的页面时,就会给他留言。

在经过不少尝试后,克里斯终于约到一名亚裔女孩。他见面时主动披露破解网站的秘诀,对方极为欣赏,二人开始恋爱关系。并在恋爱一周年后克里斯求婚成功,二人终成眷属。如此"用心",也是醉了。

食色性也 "看完速7,去速8"

《速度与激情7》

食色性也:凡是人的生命,不离两件大事:饮食、男女。《速度与激情7》上映时,"看完速7,去速8"一度成为相互调侃的流行语。而日前,猫眼电影整合了2015年上半年的售票数据,做了一个有意思的数据报告。报告根据用户购买电影票的习惯,结合用户在美团上的相关消费行为,发现了有意思的现象。

数据显示,用户在购买电影票的同时,有79%会进行餐饮消费,10%会选择唱K、桌游、足疗等休闲活动,还有11%会选择酒店消费。注意噢,酒店消费里,有81%选择的是"速8"一类的经济型酒店……

本文分享自微信公众号 - 腾讯大数据(tencentbigdata)

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2016-03-31

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 浅谈大数据应用研究的3个V

    To knowledge是目标,手段还是mining,俗称数据民工。每当大家讲到大数据,都会不约而同的提到大数据几个V的定义:Volume,Variety,Ve...

    腾讯大数据
  • Hermes-大数据利器中的白富美

    1Why:Hermes为什么会诞生? 传统的关系型数据库,在大数据面前显得势单力薄,无论数据处理、数据分析上都力不从心。TDW(腾讯数据仓库,Tencent D...

    腾讯大数据
  • 主流大数据系统在后台的层次角色及数据流向

    最近有不少质疑大数据的声音,这些质疑有一定的道理,但结论有些以偏概全,应该具体问题具体分析。对大数据的疑问和抗拒往往是因为对其不了解,需要真正了解之后才能得出...

    腾讯大数据
  • 什么是大数据测试?大数据测试实现步骤有哪些?

    近两年互联网行业动不动就喊着“大数据”的口号,大数据的诞生让很多企业节省人力物力实现精准营销获得丰厚利润。随着数据工程和数据分析技术的不断进步,大数据测试不可避...

    新梦想IT职业教育
  • 图像数据不足时,你可以试试数据扩充

    在EZDL到底怎样,试试看…中,我们谈到百度的在线AI设计工具EasyDL不需要调整任何参数,对于用户而言就是一个吃数据的黑盒子。也许系统会选择最优的参数和算法...

    云水木石
  • [Oracle ASM全解析]Oracle ASM Files

    存储在ASM 磁盘组的文件称之为ASM 文件,Oracle数据库和ASM通过ASM 文件来交互

    bsbforever
  • 安华金和创始人兼总裁刘晓韬:我们不要再谈脱离了“使用”的数据安全问题

    数据猿导读 数据安全治理目标旨在强调数据的安全使用。我们不谈脱离了“使用”的数据安全,数据存在的价值就是为了使用,为了实现数据的安全使用,数据安全治理需要满足数...

    数据猿
  • python批量爬取文档

    py3study
  • 【钱塘号专栏】企业用数据的三个小窍门

    运用数据这门学问真的就像武功,台上一分钟,台下十年功。行情好的时候不“养数据”,市场差就更难抱佛脚。在平日里,“养数据”有着大大的好处,不仅可以成为战略分析的关...

    钱塘数据
  • 物联网:数据淘金——从数据中挖掘有效信息

    如今是信息时代,得数据者得天下。然而,只是“有”数据还不够,数据的“准确性”和数据的“分析”也是至关重要的。爱因斯坦也说过:“能用的不一定有用,有用的也不一定能...

    未来守护者

扫码关注云+社区

领取腾讯云代金券