facebook数据泄漏:大数据分析竟能操控美国大选?

  • 回答 (6)
  • 关注 (0)
  • 查看 (175)

近日,facebook的数据泄露事件引起广泛讨论,罪魁祸首剑桥分析公司通过数据分析来帮助企业和政党改变受众行为。他甚至声称“只要了解用户的十个赞,就能比用户的同事更准确地评价用户”。那么大数据分析真的有他们所说的那么强吗?这是怎么样做到的?公众的个人隐私又该如何保护?

奔Reborn奔Reborn提问于
563德力回答于

如果不看这家公司“坏”的一面,单纯从技术来看,其实这种大数据分析技术还是挺先进的,只要不用来作恶,未来可能应用到很多方面。

该公司的性格分析模型来自科辛斯基,他是心理测验学(一个由数据驱动的心理学分支)领域的领军人物,其发明的个人信息计算模型可以根据简单的个人信息就推断出该数据提供者可靠的个性特质。

早在2012年,科辛斯基就证明,平均基于Facebook上的68个“点赞”,就可以预测用户的肤色(准确度95%)、性取向(准确度88%)以及政治倾向(民主党或共和党,准确度85%)。可预测的内容远不止于此,还包括智力、宗教信仰,以及酒精、香烟和毒品使用。基于数据,科辛斯基甚至可以推断某人的父母是否离婚。而在不断研究和改进后,其模型变得日益完善,即仅仅基于10个点赞,他就能比受试者的同事更准确地评价受试者;70个“点赞”足以让他比受试者的朋友更了解受试者;150个点赞可以让他比受试者的父母更了解受试者;300个点赞可以让他比受试者的合作伙伴更了解受试者。基于更多的点赞,科辛斯基对受试者的了解,甚至超过受试者自己。

这种通过大数据分析用户心理特征的方法,以后可能应用在心理治疗领域。现在社会发展很快,大多数人心里都有很大的压力和焦虑,但一般也不会专门找心理医生咨询,以后这种技术继续发展,很可能发展成线上心理咨询服务,AI陪你聊天,开导你生活中的不愉快,让亚健康的人能释放情绪得到安慰。

绯红的花io专业生产bug回答于

最近我也在关注这个事件,就来谈谈我的看法吧。

据美国媒体的报道,剑桥分析公司(Cambridge Analytica)是一家专注于政治和商业广告活动的大数据公司,该公司曾参与特朗普2016年总统竞选以及英国脱欧,并利用这些信息构建了一个软件项目,用以锁定潜在选民。

举报者说,剑桥分析公司用这些数据,搭建起一个可以剖析美国选民的数据模型,并且能够针对性地推送千人千面的个性化政治广告。

卫报更是在最新报道中指出,算法和数据库一起构成了强大的政治工具,这个工具能够在大选中尽可能找出中间选民,并制造更多的“共鸣信息”成功打动他们。

从这些报道,我们能大概能知道这家公司在利用大数据做些什么:

首先,通过facebook获得用户数据的基本数据,包括你的姓名,年龄,性别,国籍,等等。

第二步,筛选目标用户,比如美国的选民。

第三步,获取这些用户的详细数据,并建立模型,通过算法分析他们的性格特点,政治倾向等等。他们通过把微定向(Micro-targeting)和心理学结合起来,精心分析选民的数据,预测选民动向。具体分析用户的点赞,通过用户的点赞来预测用户的政治倾向,比如,你喜欢麦当娜,你很有可能投票给希拉里;你喜欢手枪,你很可能立场偏右。

第四部,向这些用户精准投放广告,让他们在不知不觉中偏向某一候选人。比如,某个用户点赞了反对难民的新闻,他们就向这个用户投放希拉里接受难民的言论,在潜移默化下达到操控选民的目的。

虽然这是让米国的糟心的事,但我们也应该警惕,因为这种结合了心理学的数据分析,只要稍加修改算法,也可能影响到我们。所以我们才应该更加注重我们个人数据的保护,而企业也应该严格管理用户的数据防止外泄。

离岛爱编程,爱画画回答于
禅心回答于

这家公司做的其实是基于心理测量学的大数据分析。

心理测量学是一个由数据驱动的心理学分支,有时也被叫做心理图像学,主要致力于研究心理上的特征,比如人格。上世纪80年代,心理学家发展出了一种基于五种人格特征来评估人类的模型,就是著名的“大五类人格测试”。

“五类”人格分别是:

  • 开放性(你对新的体验有多开放?)
  • 严谨性(你有多追求尽善尽美?)
  • 外向性(你有多爱好社交?)
  • 宜人性(你有多体贴,多容易合作?)
  • 神经质(你很容易沮丧吗?)

“大五类人格测试”已经成为心理测量的标准技术。但是,在很长一段时间里,这种手段的执行难度在于数据收集,这是因为它涉及一份复杂的、高度私人性质的问卷的填写。

然后,互联网出现了。接着是Facebook,微博等社交媒体。基于简单的网上行为,建立数据模型,通过算法他们就能得出相当可靠的推演。

举几个例子,“赞”了猫咪卖萌图片的人性格比较温和,喜欢CS,绝地求生的人可能比较暴躁。Lady Gaga追随者们极有可能是性格外向的人,而那些“赞”了哲学相关内容的人则更可能偏内向。

虽然,任何一个单独的此类信息都不足以让他们得到可靠的预测,但综合了几十、几百、或上千的个体数据之后,他们的预测就会变得非常准确。

有了这些数据模型,这些不法公司就可以对用户“为所欲为”了,推送商品广告,推送候选人某一言论来影响你对他的看法,推送竞争对手的不当之处等等。

僅茈侕巳回答于

其实不光是Facebook,微博也如此,某件事发生,你原本还没有太明确的态度,假如微博筛选出十条某一派的相似观点,一股脑地放在你的时间线上,你可能也就会被说服了。

甄三十七寻找冬日里的蓝色牧场回答于

西方主流媒体忙着黑特朗普胜之不武,而对于我们普通用户来说,可能更值得警醒的是:信息时代,想要进行调查,获取广大群众的信息,是一件多么容易的事情!

你的生活圈,基本被有地理位置权限的app知道;你的兴趣爱好,基本被搜素引擎知道;你偏好的物品,牌子,经济情况基本被电商知道;你的性格特点,基本被社交媒体知道。这些数据结合起来,你的模型的“立”起来了,一个在互联网上的“你”就这样被创造出来了,这个“你”可能被研究,被放广告,被他推送的新闻影响。

细思极恐。

扫码关注云+社区