可怕!Facebook 竟能识别出性工作者!你怎么看?

推荐 : 胡永波 翻译 : reason_W成龙 编辑 : 鸽子

Leila有两个身份,但她只在Facebook上公开了其中一个。

作为一名性工作者,她非常希望将自己作为普通人的生活,和作为性工作者的生活分隔开来,互不干扰,避免自己遭受羞辱、逮捕甚至专业的反击,以及避免那些可能的纠缠不休(或更糟)的客户。

她在Facebook上公开的”真实身份”为:Leila(本文使用名称均为化名),居住地加利福尼亚州,她经常发表一些关于政治的帖子。

为了保护自己性工作者的身份在社交网络上不被人知晓,她一直小心翼翼,坚持使用不同的电子邮件地址,不同的电话号码和不同的网络昵称。

今年早些时候,当她看到Facebook自动推荐的”你可能认识的人”的时候,Leila非常震惊地发现,居然可以在里面看到她作为性工作者曾经服务过的一些客户。

尽管她已经竭力保持不让自己性工作者的身份暴露到Facebook中,但没想到Facebook依然发现了她的秘密。

更令人恐惧的是,这些人也有可能在”你可能认识的人”中,知道她的日常身份。

但因为Facebook一直没有公开,其是如何将一个用户和另一个用户联系到一起,所采用的方法和数据,因此,Leila也无从知晓她的身份是如何在互联网上被辨别出来的,应该如何采取措施来防止这样的事件再次发生。

“不仅仅是性工作者要小心保护自己的身份,”Leila通过Skype对gizmodo的记者说到。

Leila继续说道,“那些与性工作者发生过关系的人,也对保护自己的身份信息十分在意,所以他们也常常使用替代的电子邮件和替代昵称。

在进行色情交易时,虽然他们也交换电话,但这只有在他们想和人发生性关系的时候,才会使用的电话号码。跟日常的电话号码完全不一样。总的来说,客户和性工作者双方对于安全性都比较在意,大家都不想透露身份。

可是万万没想到,掩盖那么好,竟然还是被Facebook发现了,还被悄悄地连接了起来,最恐怖的是,还都是各自的真实身份。真是要命啊!”

这些性工作者都有自己的秘密支援团队。

当Leila在秘密支援团队中咨询自己该怎么办时,团队中相当多的人也表示同感——他们有同样的遭遇。

“我们的预防措施那也是相当到位了,电话号码都是专用的,真是见鬼了,居然在Facebook上给联系上了,还他*&¥%#妈@#¥%的显示各自的真实姓名和工作?你%……¥大#¥%爷¥%&的,以后出事了叫我怎么有脸见人?”秘密支援团队的另一个人抱怨到。

Leila说:“性工作者,最恐怖的噩梦就是把你的真实姓名留在那里,Facebook这样把人连接起来,让这个噩梦成真了。”

那么,Facebook到底是如何做到的呢?

至今为止,Facebook并没有将“你可能认识的人”到底用的什么推荐算法,进行公开(这个算法在Facebook内部称为PYMK黑匣子)。Facebook一直强调,其推荐的建议“来自”共同好友,共享网络或群组,或用户上传的联系人。

然而,这样的说法,经不起考验。

Facebook发言人今年夏天曾告诉Gizmodo记者,PYMK参考的因素超过了100项。所有像Leila这样的人——即和客户没有任何共同好友,共享网络或群组,或者联系人关系,却被算法判定为可能认识的人——他们竟然能被推荐认识,其数据一定来自其他方面。

Leila怀疑Facebook收集了手机上其他应用的联系信息,或者使用了她位置信息,从而发现她和她的客户的智能手机同时出现在同一个地方。

但是Facebook的发言人通过电子邮件否认了这件事。

邮件写道:”我们不会使用第三方应用程序中的信息来作为”您可能认识的人”中的朋友建议的参考。 Facebook之前也已经说过,”你可能认识的人”的推荐算法并不会使用位置信息作为参考因素。

虽然Facebook的发言人对这一问题进行了坚决的否认,但我们在Quora上发现,南加利福尼亚大学信息科学研究所的研究人员Akhil Bhiwal的一篇的回答已经被Facebook前顾问悄悄点了赞。

这篇点赞量687,浏览量将近25万的回答表示,如果双方都对Facebook开放了位置权限(不管是在移动端还是在网页端),并且多次访问过相同的地方。那么Facebook的推荐系统便会使用你们在相同地点的共同事件和发生频率在提供好友建议。

比如,你访问了A、B、C、D、E、F,你的邻居访问了A、X、C、D、Z、W。在这种情况下,A、C、D就是你们共同访问的共同场所。那么你们两个就很有可能会互相认识,因为你们都访问过类似的地方(特别是在同一时间)。

现在让我们慢慢的增加访问次数

现在,因为你们两人都曾多次访问这些地点,这就增加了你们互相了解的可能性。在这里A因为访问频率超出其他,所以很可能被判定为你的家。

当然,除了单纯的位置因素,也有很多其他和位置有关的因素,比如位置语义信息,可以用来推荐。举个例子,例如,如果你和某个人Z同时访问了某个特定的地点,那么你们就很可能有相似的兴趣,并且可能会愿意成为朋友。

如果你对详细的技术算法感兴趣,还可以参考南加州大学的这篇论文:EPM-一种从时空数据推断社会关系的基于熵的模型

http://infolab.usc.edu/DocsDemos/sigra619.pdf

无独有偶,2016年8月,刊登在Gizmodo上的一篇文章,似乎也将矛头指向推荐系统中所透露的地理位置信息。

在这篇名为《 Facebook recommended that this psychiatrist's patients friend each other-https://splinternews.com/facebook-recommended-that-this-psychiatrists-patients-f-1793861472 》(Facebook 建议精神病医生与病人相互交往)的文章中,Lisa是一位精神病医生,他的病人,都是一些身心发育有严重问题的患者,这里面包括艾滋病患者,自杀倾向严重的抑郁症患者,有暴力倾向的狂躁症患者......

为了保护患者隐私,她在Facebook中从来没有将有关任何病人的任何资料,以及任何相关的内容放上去,可是,突然从某天开始,她所有患者的全名和个人资料开始出现在她的Facebook好友推荐里。

她无比惊讶,不知道Facebook是怎么做到的。

有分析称,正是因为Facebook通过智能手机定位发现了这些秘密。因为,她和她的病人都在同一个地方,同一个时间出现,并且反复出现。

看来,关于第三方应用的信息使用与否,看来Facebook发言人的回复也不是那么可信 。而在另一个234赞,22万浏览量的回答里,答主Prithvi Raj表示,其实早在2010年的时候,Facebook就收购了Octazen。而至于为什么要收购Octazen,其原因正是获取数据,并用于推荐系统。读者也可以参考这篇文章

Octazen: What The Heck Did Facebook Just Buy Exactly, And Why? http://techcrunch.com/2010/02/19/octazen-what-the-heck-did-facebook-just-buy-exactly-and-why/

这些数据公司悄悄获取你的各种邮件和其他应用程序,以及联系人列表,并以此将你与其他人进行连接。

比如:

  1. 通过邮件列表匹配的方式:也许你邻居的账号只在你的新gmail账号联系人列表里保存着,但在你的旧gmail账号中,因为你的名字和你的新账号一样,因此你的邻居就有可能通过这样的方式和你的旧gmail邮箱匹配到一起。
  2. 通过应用程序匹配的方式,可以这样理解,在app启动后,Facebook会将手机当前位置和当前手机通讯录内容搜集起来,进行匹配。
  3. 而通过将上述几种方式匹配的结果结合起来,再进一步组成社会关系网,你们共同的朋友,朋友的朋友也就可以被计算出来

基于这些数据,他们就能够对谁可能是你可能认识的人做出有力的判断。

还有用户发现,同为Facebook旗下的whatsapp中的联系人信息也可能已经被Facebook在内部“共享”了。

当用户在whatsapp中同一些人交换过文件之后,facebook的好友推荐列表里就会出现这些人。

此外,Facebook很可能还会搜集用户的搜索数据。

那些在Facebook上搜索过你的人(哪怕他们删除了搜索记录,这依然可以作为活动日志被找到)、那些在朋友的照片或相册中标记过你的人、拥有大量共同好友的人、隶属于同一个社交网络(学校、工作、城市等)、参加过同样的活动或者链接到同一个媒体账号的朋友,甚至于那些被你拉黑的人的朋友都有可能被列入“你可能认识的人”列表中。

而且这些建议不仅仅是基于“搜索”,用户设备上的其他程序和应用中出现的任何地方的名字都可以被Facebook的算法所识别。

Facebook可以访问其正在使用的设备(PC,笔记本电脑,手机)上可能包含某人姓名的任何内容,然后将该人标记为“可能认识的人”。例如,当我将Google日历用于我的商务约会时,Facebook会向我建议的“你可能认识的人”中很多来自我最近在Google日历中约定的客户。

回到Leila的例子。

无论Facebook 所采用的PYMK算法究竟工作原理是什么,这样的机制,很有可能会对性工作者和色情行业的人造成严重后果。

在这个隐私权极其被看中的圈子,每一次精准推荐都会让当事人战栗。

Stabile是加利福尼亚的一个成人内容表演者,他说到一件令所有人最为尴尬的事件,那就是:当性工作者的账户被推荐给了他们在现实生活中认识的亲人、朋友时,那种丢人,让人恨不得找个地缝钻起来。

Darling在CAM4网站负责管理虚拟现实成人广播,他从事色情行业已经有八年之久,但她的家人不知道。

“我不希望因为我在Facebook上的帐户被推荐给亲人,让我15岁的表弟发现我竟然是一个色情明星。”Darling说道。

为了避免这种情况,她几乎每隔几周就会在Facebook上搜索一次家人和家族成员的姓名,看看她的亲戚是否已经加入了Facebook,或创建了一个新帐户。如果有的话,就赶紧拉黑他们。

Darling曾经用她的真实身份注册过第二个私人账号,用于和她在正常生活中认识的人进行联络,但是有些她在色情网站上的粉丝却在“可能认识的人”中推荐给了她的这个正常的私人号,从而让粉丝们知道了她真实身份。

她说,从那以后,这些人开始骚扰她,并试图跟踪她的家人。

“我们正生活在一个恐怖的时代,你都不知道个人信息是怎么泄露的,泄露后又是如何被别人当作武器来攻击你”,Darling说,她不知道Facebook是如何将她是色情工作者的身份与她公开的身份联系起来。于是,她不得不删除了她的私人账号。“我对于Facebook无时无刻不在收集着我的信息,简直不安。”

“对于性工作者来说,这是一个巨大的威胁,生死攸关的大事,”Leila说。

原文地址

https://gizmodo.com/how-facebook-outs-sex-workers-1818861596

原创声明,本文系作者授权云+社区-专栏发表,未经许可,不得转载。

如有侵权,请联系 yunjia_community@tencent.com 删除。

编辑于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏AI科技大本营的专栏

可怕!Facebook竟能识别出性工作者!你怎么看?

推荐 | 胡永波 翻译 | reason_W成龙 编辑 | 鸽子 Leila有两个身份,但她只在Facebook上公开了其中一个。 作为一名性工作者,她非常希望...

3627
来自专栏PPV课数据科学社区

【信息图】剁手族,你以世界杯名义网购了啥?

面对四年一度的世界杯,“剁手族”还有时间网购吗?整体来看,在足球的诱惑下,男人有点分心了。然而,女人誓与世界杯抢男人的决心,简直令人受宠若惊! 快跟小编来一探究...

2729
来自专栏大数据文摘

业界 | 数据可视化项目失败的六大缘由

1474
来自专栏IT派

论如何成为技术大牛,GitHub中国区前20名详解

本文根据Github公开API,抓取了地址显示China的用户,根据粉丝关注做了一个排名,分析前一百名的用户属性,剖析这些活跃在技术社区的牛人到底是何许人也!

1000
来自专栏顶级程序员

你可能不信,我看pornhub是为了拯救大熊猫和乳腺癌,还有学python

源 / 顶级程序员 文 / 奶糖 China NO. 1! 这一次,我们伟大祖国再次拿下了一个世界第一。 我们成为全球最大色情网站Pornhub,在线观...

2.2K7
来自专栏华章科技

我用Python做了六百万字的歌词分析,告诉你中国Rapper都在唱些啥

《中国有嘻哈》火了,作为一名对中国HipHop毫无了解的吃瓜群众,我开始好奇以下三个问题:

742
来自专栏阮一峰的网络日志

自动售书机问世了!

去年年底的时候,我曾经介绍了《财富》杂志评选出2007年最具有创意的十种新产品。其中有一种是类似ATM的自动售书机,只需按几个按钮,一本新书就会自动打印和装订,...

31912
来自专栏腾讯研究院的专栏

网络新纪元

2.jpg 推荐语: 有个段子说,做互联网的人谈论大数据,就像青少年谈论性——人人都在兴奋地说,人人都不知道怎么做。看了这篇文章,您还是不知道怎么做...

18210
来自专栏编程坑太多

那些大厂的全栈工程师有用武之地吗?

1003
来自专栏华章科技

从大数据中挖掘什么?

大数据挖掘中最重要的是决定挖掘什么样的知识,这是在数据的收集、处理、挖掘的整个过程中都需要认真考虑的问题。本文首先提出大数据挖掘的几项策略,即尽量设想挖掘的场景...

302

扫码关注云+社区