通过算法为宝宝选保姆,数据辅助决策靠谱吗?

作者:Rachel Botsman 翻译:reason_W

你会根据什么选择保姆?直觉?——还是能够告诉你预约排名最高的保姆的算法?

我对陌生人的第一次信任危机发生在1983年,那个时候我还没满5岁。我还记得那天的夕阳好像很不错,一个陌生的人来到了我们家。那是一个快30岁的女人,叫Doris(多丽丝),来自格拉斯哥。妈妈在《英国夫人》杂志上发现了她的求职广告,就把她聘过来做我们家的保姆。

多丽丝穿着一身连帽的救世军制服。妈妈回忆说:“我记得她浓浓的苏格兰口音。 “她告诉我,她之前一直给我这么大的孩子当保姆,并且一直是救世军的一员,因为她很喜欢帮助别人。当然老实说,她也让我很开心。”

多丽丝和我们一起生活了10个月。很大程度上来说,她确实是一个很好的保姆——开朗,可靠和乐于助人。除了周末有一些不明原因的缺席之外,她并没有表现的太不寻常的地方。

▲图片来自于网络

当时,我们的邻居,卢森堡先生家的保姆经常和多丽丝在一起。直到有一天晚上,卢森堡先生突然敲响了我们的家门。因为他发现这两个人在打电话的时候里涉及到了毒品交易。“他们甚至曾参与过一起武装抢劫”,父亲后来说到,“多丽丝开车逃跑了”那辆车,就是我们家的沃尔沃Estate。

我父母决定去多丽丝的房间搜一下。在她床边的鞋盒里,我们发现了她从我爸妈办公室偷来的一沓外币。那天晚上,为了提防多丽丝回来,爸爸拿着棒球棒在门口站了整整一晚。幸运的是,她没有。

妈妈说:“现在哪怕是再想一想这个故事,我都会觉得恶心。我居然把你交给了一个这么可怕的罪犯照顾,而且过了很久都还没有发现。”现在回头想想,她有什么不对劲的地方呢?“我真希望我们在雇佣她之前再多了解她一点。”

我的父母不管在智商还是理智程度上都是很普通的人。那么,在今天这样一个数字化的世界里,他们还会再犯同样的错误吗?也许不会吧。越来越多的技术公司正在努力帮助我们进行决策,消除这种不信任感,不管是雇保姆、房屋租赁还是叫滴滴。今天的技术比以往任何时候都更加了解我们。但仅仅凭一个算法就真的可以确定谁值得进行交易,谁又不能被信任吗?真的比人更好吗?

在一个秋天的清晨,我为了拜访Trooly公司来到了Los Altos这个城市,这是一个位于硅谷北部的一片与世隔绝的水湾。Trooly的CEOSavi Baveja想要向我展示这些计算信任度的软件有多么值得被信赖。“想不想让我通过Trooly软件来检测一下你,看看结果是什么样的?”他笑着鼓动我。

我的脸一下子就红了,记忆里又开始回忆曾经做过的所有糟糕或尴尬的事情。我超速和违规停车的罚单有多少次?我经常上的那些奇奇怪怪的网站又都是什么?还有一些老照片,可千万不要被他们挖出来。

我因为紧张不好意思地笑了出来。“别担心,我们可以把它们投射到大屏幕上,以便您可以实时了解发生的情况,”Baveja安慰我说。但不知怎的,我并没有觉得很安心。

Trooly的首席技术官,同时也是和Google之前的高级研究员,Anish Das Sarma,把我的姓氏和名字输入到Instant Trust程序中,然后输入我的电子邮件地址。然后就没了,没有输入出生日期,电话号码,更别提我的职业或地址。

Boreja解释说:“Trooly的机器学习软件现在主要依靠三个已授权的公共的数据源。 首先,是公民记录,比如出生证明、结婚证、洗钱监察名单和性犯罪者的登记名单。任何公共和数字化的全球登记表都可供我们使用。”

然后,一些隐藏的网站会被重点关注。这些仍然属于互联网,但却隐藏了起来,很少有搜索引擎能检索到他们。那么谁还在使用它呢? “讨厌社会的人,恋童癖,或者某些持枪者。这些无法被现实社会容纳的人就生活中这些网站上。”

最后一个数据源是社交媒体,如Facebook和Instagram。当然官方医疗记录是禁止的。然而,如果你发了一条状态说,“我刚刚做了一个可怕的背部手术”,那么这些信息就可以被归类为合法的允许使用的数据。Baveja和他的团队花了九个月的时间来挑选这些他们应该和不应该使用的数据。关于未成年人的那部分数据已经被筛选出来了。“在一些国家,”他说,“对‘私人’和‘敏感私人’信息之间的差异有一个合法约定的定义——后者包括医疗,以及种族,宗教,工会会员等。所以我们这这些信息面前画了一条线,因为我们非常了解越过这条线之后令人毛骨悚然的结果。”

如果有人的Twitter帐号常常有自我转发和谩骂的内容,那个人很可能是反社会人格。

过了大约30秒,我的结果出来了。“看,你是这种人!”Baveja说。我们的系统按照最值得信赖的程度,从1到5进行了排名。“只有约15%的人才属于这一种;他们的可信赖度“非常好”。”

我感到一点儿庆幸,也有点儿自豪。那么有多少是“非常坏呢”?“在Trooly覆盖的人口里,约有1-2%,包括美国和英国在内,最终能达到4-5%。”

Baveja以前是Bain&Company咨询公司的合伙人。他服务最长久的客户之一就是“知名的在线市场”。这也让他开始思考数字世界中信任的重要性。他说:“我们的客户需要拿出全部预算的6%——得有数亿美元——来应对市场上可能出现的问题。” 他说,“这让思考那些典型的星级评估系统是怎样不足以防止在线事件的大量发生。”

那个时候,Baveja的妻子正在参加一个小型的牙医实习。经常会有人拒绝付款,甚至威胁要留下差评。而到了周末,还会有人打电话要求毒品。 Baveja说:“事实证明,相对于大型企业来说,小企业对客户知之甚少。如果他们有办法把这些潜在的坏客户清除掉,那不是很酷吗?

为了计算我的信任值,Trooly的软件在不到30秒的时间内就从8000多个站点上爬过了超过30亿页的数据。数据被合并成三个部分。最基本的那个用来验证我的身份。我是我自己所说的那个人吗?这通过扫描我的个人网站来核对我的大学简介。接下来是筛查非法,冒险或欺诈活动。但最令人惊讶的还是第三类,其中我被评估为“暗黑三合一性格”,一种无情到让骗子都佩服的性格:自恋(自私与过度的注意焦虑)、精神病(缺乏同情或悔悟)和马基雅维里主义(一种缺乏道德的高度操控的性格)。不幸的是,Baveja不能在这一项单独给我一个分数,但是我很安全的通过了。

两年前Trooly获得了美国专利,该软件用于“确定一个人的可信度和容纳他人的特性”。其算法的设计也考虑了80年代研究人员广泛接受的用于评估个性的“五大”特征——开放性,认真性,外向性,容纳性和神经质性。Boreja说:“Trooly开发了复杂的模型来预测这些特性,并且用到了来自个人在线足迹的数百个特征。有趣的是计算出这些足迹中,哪些可能有助于预测这个人到死是神经质还是粗鲁的。如果你看到某人的Twitter帐户有过太多的自我转发和谩骂的内容表达了自己,那么这个人更有可能是反社会的。”

我还记得我18岁的时候和父亲那场开心的对话。我看到一个漂亮的二手标致在eBay上出售。 他指出,卖方的笔名是隐形向导,这并没激起我们在eBay上买车的勇气。所以我们去了当地的汽车经销商那里买车。

这几天,即使我谨慎的父亲时不时也会上eBay购物。作为一个社会人,我们正在越来越多地使用这些互联网技术进行更亲密的个人互动,而且通常是和陌生人,不管是分享我们的家庭和汽车,还是在线寻找爱情或保姆。但是当你第一次与某人联系的时候,你如何知道他们时不时值得信赖?他们真的是他们说的那样吗?甚至有时候它真的是一个人吗?

▲信托检查公司Trooly首席执行官Savi Baveja

照片由Savi Baveja提供

这些都是UrbanSitter(一个总部位于美国旧金山的按需保姆服务平台)这样的公司需要回答的问题。这个美国网站将家庭与保姆联系起来,其用户有超过35万的父母和30万保姆。与许多在线服务一样,他们必须通过Facebook或LinkedIn加入。结果,43岁的创始人林恩·帕金斯(Lynn Perkins)说,“当你去预订时,你可以看到有多少‘朋友’曾经预订或者以某种方式与这位保姆联系在一起。”

系统会为每一位保姆和家长创建详细的资料文件。人们愿意披露的细节数量和类型都是巨大的。“一位家长的要求里包括了关于他们那头大肚子的猪的长篇说明”,珀金斯回忆说,“他们想确保保姆能对他们的宠物感到舒适。这听起来很奇怪,但却对网站的管理水平提出了很高的要求。”

最终的安全级别由Trooly和他们的对手信任评级服务(如Checkr)提供。保姆是否真的得到了南泰勒斯学院的保育文凭?他或她有没有曾在线发表过犯规的语言吗?他或她有没有性犯罪记录?

只有25%进行过注册的保姆会被审核进入平台。其余75%都被拒绝或放弃,因为他们不能或不会跳过审查环节。

事情在这个勇敢的新世界中一再出现,但几乎不可能让珀金斯这样的企业家来情况承认他们的平台上发生的这些不良事件、轻微或严重事件的精确数量。“他们确实发生,但他们也确实非常罕见”她会这样说。

今年6月,Airbnb以一笔尚不可知的款项收购了Trooly。随着诸如中情局前副参谋长尼克·夏皮罗(Nick Shapiro)这样的人在2015年加入了Airbnb,并担任全球信托和风险管理负责人之后,这样的对风险事件的投资已成为常态。“获得和保持信任将永远是任何职能社会的核心部分,”夏皮罗说。“发生改变的只是交换信任的地方以及交换的方式。相比于大企业,媒体或政府等主要机构的信托服务,大众对彼此的信任交换正在发生的越来越多。

他的声明中的一部分是要弄清楚当事情出现问题时,Airbnb该如何回应。就拿大卫·卡特(David Carter)来说,他在2014年3月的周末通过Airbnb预订了一个豪华的纽约公寓。他告诉公寓的主人阿里·泰曼,他正在寻找一个地方,来方便他的兄弟和嫂子留在城里举办婚礼。但是事实上,他所谓的“嫂子”竟然是一群以“大美女”和毛绒动物为特色的狂欢型的客人。要不是阿里·泰曼碰巧要返回到他的公寓拿行李,根本不会发现这个限制级的party。

但是卡特的Airbnb帐户之前已经经过了验证,并且评论也都很正面。“我们有责任回去看看我们能不能做一些不同的事情,”夏皮罗说。 “这仅仅是一个失误吗?”换句话说,像卡特这样的人,我们该怎样在系统里淘汰出来?

我们正在寻找那些曾有过暴力犯罪历史或曾用过假身份的人。但我们不在乎您是否发送了一个愚蠢的推文或收到过一张停车罚单。

“你可以很容易地想到这样的事情,”Baveja说。“你不需要深入卡特的内心才能发现这家伙是一个性派对的组织者。”只需要在谷歌简单搜索一下卡特的电子邮件地址就可以发现诸如内裤袭击这样的广告。有些人甚至直接用“XXX怪物节”的标题在推特中给出了公寓的地址。

“看到他的个人资料,我又学到了一个新的字母缩略词” Baveja说。“我甚至为想到这些脸红。”

我又想起了我们家之前的那个保姆,问Baveja,要是多丽丝也在UrbanSitter上进行申请,这个软件会发现她吗?Baveja给了我肯定的答复。我的父母会知道她并不在救世军当中,以前也没有过给孩子当保姆的经历,以及她以前那些劣迹斑斑的犯罪史。多丽丝不会在这个软件下逃脱。

那么我们应该接受这些新的信任算法吗? Baveja和Shapiro承认了尝试采取道德决策并将其转化为代码的责任。那我们应该为这种方式暴露多少我们的个人信息?并且我们能在多大程度上接受让算法来判断谁是值得信赖的人的做法呢?

在我的Trooly测试中,我发现自己其实很担心公司会注意到我以前那些微不足道的“违法记录”。他们会不会很在意?

“没有人喜欢被机器人或其他人评估,但这不是我们的筛选方式,” Shapiro坚持道。“我们正在寻找那些诸如仇恨集团的成员,或者曾有过暴力犯罪历史或曾用过假身份的人这些重大隐患。但我们不在乎您是否发送了一个愚蠢的推文或收到过一张停车罚单。”

不过,这些事情可能会对雇主产生影响。招聘人员正在越来越多地使用数字足迹和机器学习过滤候选人。招聘工具如“百荣”,“Talview”和“社会指数”都提供了汇总和分析在线数据的产品,以确定那些候选人和公司文化是否匹配。

但是还有其他问题。例如,“数字幽灵”的后果呢?像我的丈夫这样的人,从来没有使用过Twitter、Facebook或LinkedIn。那么他的这些“单薄的可查询记录”是否降低了他被认为值得信赖的能力?

“对于那些没有足够的数字足迹或没有足够的准确输入的人,我们不能很自信地给出分数。这样的人大概有10-15%”Baveja承认。

在诸如Airbnb之类的网站上,隐形不一定对您有所帮助。 “我们正在寻找负面的信息,”夏皮罗说,“虽然没有信息并不会对你造成不利影响。”

在这样一个只需要滑动几次手机就可以随时随地找到人来修理漏水或者开车送我们回家的世界当中,在线信用评级发生的将会更加普遍,更加智能和普及。

我们正在开始将信用卡信息暴露在互联网上,或者在Tinder上进行匹配,虽然感觉有点奇怪,甚至是危险的,但是这个想法很快就会变得再正常不过。那么技术真的能够剥离和陌生人打交道的全部风险吗?

不能,UrbanSitter的珀金斯摊了摊手。人类是复杂的道德生命,完全把自己从构想中剥离是愚蠢的。“但是如果一个保姆的出现让你有种奇怪的感觉,那么无论他们是否已经通过检查,无论他们在审查中表现的多好,或哪怕是因为你对他们在网络上表现一个想法,都可以顺着你的直觉,取消和他们的雇佣关系。

如果这个责任仍然在我们身上决定着我们的信任地位,那么我们现在其实正处于一个更好的位置,来提出正确的问题并找到正确的信息。这应该也意味着我们不太可能聘请一名涉毒的银行抢劫犯作为保姆。

原文链接: https://www.theguardian.com/technology/2017/oct/07/can-technology-help-you-pick-best-babysitter-trust-online-safety-checks

本文分享自微信公众号 - AI科技大本营(rgznai100)

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2017-11-09

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏大数据文摘

【深度】淘金大数据:航空工业催生万亿商机

20650
来自专栏罗超频道

《月光男孩》夺奥斯卡闹乌龙,人工智能却被打脸了?

每年都有奥斯卡,但今年奥斯卡却非常不一样:闹出了一个巨大的乌龙事件。 在台上时,“雌雄大盗”比蒂和费·唐纳薇一起颁奖,比蒂看到本属于最佳女主角的信封犹豫了一阵,...

35180
来自专栏VRPinea

CJ 2017第二弹:比外面天气更加炽热的,是展会现场那一颗颗焦急等待体验VR的心

39690
来自专栏大数据文摘

【译】新加坡强国之梦:以大数据为基石,建筑智能之国

23530
来自专栏javascript趣味编程

写在开始:借助现代信息化工具探讨做好“新工科”的建设

助现代信息化工具探讨做好“新工科”的建设,培养出更加优秀的人才。 主要但不囿于如下内容:

22440
来自专栏机器人网

杀戮机器人来了?人类对AI的威胁更恐慌?

自从机器人诞生以后,人类对机器人的恐惧随着技术的不断发展而升级,最近,一段名叫“杀戮机器人”(Slaughterbots)的YouTube视频再度在网上引起了恐...

39240
来自专栏VRPinea

先睹为快!CES 2017最佳创新奖30款产品为您揭晓

29960
来自专栏罗超频道

Super快报第20期:搞个锤子的周六

一、老罗罗永浩的手机“操作系统”:搞个锤子 罗永浩要做的“罗氏”手机终于有点进展了。3月27日将发布手机“操作系统”,准备的说是基于安卓的一套主题。我一...

33760
来自专栏VRPinea

一周VR热点回顾:如何判断一个人是不是90后,看他的第一部手机!

30190
来自专栏VRPinea

哈喽VR:超硬核机甲VR游戏,男生的梦想!

爱奇艺VR频道,可提供大量360度VR全景视频的在线观看。同时,也有诸多VR行业热点资讯与VR游戏、硬件测评等综合性内容。

12120

扫码关注云+社区

领取腾讯云代金券