Facebook大数据:兴奋与恐惧同行?

作者:Bernard Marr

翻译:大数据文摘翻译组 瑾儿小浣熊

Facebook, 这个在世界范围内拥有1200亿用户的流行的社交网络,由于其拥有的巨量数据,已经成为一个大数据天堂。

我们这些Facebook的用户们愉快的喂养着这个大数据的野兽,每天发送100亿的Facebook消息、点击45亿次“赞”、上传3.5亿新照片。整体而言,Facebook上有170亿地点标记,以及2500亿的照片,这个数量是惊人的!

所有这些信息都意味着,Facebook知道我们长什么样子,我们的朋友有哪些,我们关于大部分事物的观点如何,我们的生日是几号,我们是否在恋爱中,我们在哪,我们喜欢什么不喜欢什么,等等等等!这对很多商业公司来说是非常巨大而有力的信息!

作为一个帮助公司获取大数据的专业工作者,笔者敬畏Facebook正在创造的大数据金矿。笔者相信,即使我们现在停止使用Facebook,这家公司也拥有足够未来几年使用的数据来研究我们(他的用户)。历史上没有哪家公司如同它一般拥有关于如此详尽的个人信息!同时笔者也相信,除了Google可能与之抗衡之外,这个星球上不会有另外一家公司能够拥有接近Facebook水平的大数据!

当然,Facebook已经很敏锐的意识到了这一点,并且他们的整个商业模式也是基于如何更加有效的利用他们的大数据。我们越多使用Facebook,他们也就会越了解我们,而他们拥有的数据信息也就将会更有价值。Facebook现在正在大力投资收集、存储以及分析用户提供的数据,但是他们对数据的渴求并没有止步于此!

Facebook超越了简单的用户数据分析和数据挖掘。“今日美国”揭示了Facebook如何通过网络跟踪用户。通过使用“追踪cookies”,Facebook可以收集你所访问的任何网站的信息。这意味着,当你登录到Facebook并且浏览其他网页时(即使这个网站与您在Facebook的活动完全分开),Facebook依然知道您在浏览什么网站。

Facebook还投资了图像处理和“人脸识别”功能,这将使得Facebook可以“跟踪”你,因为它可以通过你分享的照片知道你和你的朋友们的长相!同理,它就可以通过搜索整个网络来找到你和你的朋友们!

人脸识别技术允许Facebook对你上传的照片使用“标签建议”,但是,它能做的远远不止如此,是超乎想象的。试想一下Facebook将如何使用电脑算法来跟踪你的身形!他们可以分析你分享的最近在海滩的照片来发现你是否变胖了。然后,他们就可以将这个信息卖给减肥俱乐部,而这些减肥俱乐部就可以在你的Facebook页面投放广告!可怕么?!

不仅仅如此!最近的一项研究表明,通过分析一个人在Facebook点“赞”的数据就可以预测一系列高敏感的个人特性。这份由剑桥大学和微软研究院进行的研究显示了如何使用Facebook是的“赞”来精确预测你的性取向,生活满意度,宗教信仰,情绪稳定性,是否饮酒或吸毒,情感状况,年龄,性别,种族和政治观点等等。有趣的是,那些“揭示性”的“赞”往往没有或者只是很少有它所预测的属性,并且通常一个“赞”就足以产生一个精确的预测!

笔者对Facebook使用用户数据有一个大的忧虑:它不是通过一个真正透明的方式进行!他们一直借口到:这些对数据的使用都被用小字阐述了。但是我们又有多少人在注册一个网页的时候会去读那些小字呢?并且当Facebook更新他们的隐私政策的时候,我们又会不会去重新读一遍呢?答案是:“不”!

看起来大部分Facebook用户同意笔者的看法,但是其中有两个人觉得Facebook已经做的太过了:他们扫描用户的私人邮件内容!金融时报今日揭露,Facebook受到了集体诉讼。来自阿肯色州的用户马修·坎贝尔和来自俄勒冈州的迈克尔·赫利已经代表1.66亿Facebook美国用户提出对Facebook的诉讼!这项指控提出Facebook在未经用户事先同意的情况下扫描用户通过Facebook平台发送的私人电子邮件违反了电子通信隐私法。

这里的问题是,“私人”消息在大部分用户看来是隐私的!指控提出Facebook识别出私人信息中包含的网站链接(URL),然后搜索这个网站来配置用户信息。在指控中坎贝尔和赫利说:“让用户认为Facebook消息是隐私的为Facebook提供了特殊的赚钱机会,因为那些认为他们在一个无监督的服务器上交流的用户很可能会泄露一些当他们知道被监测时不会谈论的信息。”

以为Facebook发言人在Bloomberg说,这些指控是没有根据的,而Facebook讲积极为自己辩护。他们当然会这么说! Facebook现在的麻烦是如何平衡为客户以免费社交网络平台形式提供服务与股东利润之间找到平衡点,特别那些关于销售用户数据和通过大数据洞察广告投放方法的利润。

对于笔者来说,Facebook(以及许多其他的公司,包括Google,Yahoo)都试图以某种方式隐藏它们分析和挖掘用户数据的程度。用户需要更多的透明度!比如让用户对自己的数据是否可用进行控制! 这种透明度的提高将会有助于重建国家安全局揭露大数据分析造成的声誉受损。

您又有什么感想呢?当你知道Facebook知道你的一切,并且可以利用和出售这些信息的时候,你是否会觉得可怕呢?这又是否使得Facebook非常强大呢?请分享您的观点!

摘自:作者博客

原文发布于微信公众号 - 大数据文摘(BigDataDigest)

原文发表时间:2014-02-23

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏知晓程序

1.5 天,650 人,他们用小程序做了一场阅读实验 | 晓组织 #5

每周,我们都会邀请优秀的小程序开发者,从产品/开发/运营等角度,分享他的小程序实战经验。如果你想成为「晓组织」的一员,请发送邮件至 bigbang@ifanr....

7810
来自专栏程序员的SOD蜜

师傅引进门,修行在个人--架构培训感言

成为一个优秀的架构师还有很长的路要走(软件架构案例分析和最佳实践培训收获) 2009-12-25到27日我们参加了某软件培训机构的的《软件架构案例分析和最佳实...

30080
来自专栏CSDN技术头条

怎样判断一个人是否适合做数据分析?

网友问:部门要找几个人做数据分析。现几个人原来是在不同的岗位上的,以前没有做过数据分析,怎么样才能看看出他们是不是适合做数据分析呢,在进行竞聘时使用什么样的题目...

21960
来自专栏罗超频道

算法有三个陷阱,移动资讯客户端如何规避?

今天朋友李俊在朋友圈的一则吐槽引发了我对移动资讯客户端的思考。 前几天有在媒体平台工作的朋友问我:为什么他们怎么努力都达不到今日头条如今的高度? 抛开一切因素,...

35870
来自专栏Java学习123

程序员如何持续提升自己的开发技能

35990
来自专栏AI研习社

如何让人类上瘾 浅谈聊天机器人抓住用户的艺术

在飞速发展的 AI 领域,聊天机器人极有可能是下一个风口。 在其核心,聊天机器人做的事情,是模拟与用户的双向通话。取决于不同的场景和目的,谈话内容有可能是天气,...

34360
来自专栏大数据文摘

预告:今天中午“百度图说”内测版上线

20090
来自专栏大数据文摘

Google是如何做移动搜索的

368120
来自专栏大数据文摘

业界 | Facebook F8开发者大会首日:扎克伯格走心演讲,VR硬件发售

17370
来自专栏罗超频道

Facebook社交图谱搜索暂时只是逻辑正确产品

罗超为腾讯科技Ping撰稿。2013年4月19日独家发布于腾讯科技首页。 两天前,Facebook首次对社交图谱搜索进行了小规模的广告测试。早些时间Facebo...

28840

扫码关注云+社区

领取腾讯云代金券