大数据分析客户一夜情,Uber摆明了惹众怒啊!!

  来源:平说

  挑战传统出租车行业的打车软件Uber,近来再次引起争议。该软件通过客户的使用习惯和地理位置,标出了“一夜情多发地”。

  这家租车中介公司一直以行事大胆而饱受争议。这一次,这家美国企业招惹的不是出租车行业,而是他自己的客户——这也出乎Uber自己的意料。

  在一篇已经被删除的博客上,Uber展示了他们充满创新精神数据专家如何神通广大。这篇博客中说:“我知道,我们不是你们生命中唯一的爱人,我们也知道,你们会在别的什么地方寻找爱情”,Uber以此证明,他们可以通过数据分析了解客户的爱情生活。

 波士顿很随意,纽约客较拘谨

  这家美国公司对自己的客户数据进行了过滤,专门挑选那些在晚上10点到凌晨4点用车服务;同时这些客户会在四到六小时之后,在距离上一次下车地点160米以内的地方再次叫车。Uber称之为“荣耀之旅”——实际上就是所谓的一夜情。

  根据这些数据,Uber推断出那些发生一夜情的时间和地点,并将这些地点在纽约、旧金山以及其他美国城市的地图上进行标注,分析出一夜情尤其频繁的地区。由于互联网永远不会忘记,而且又有了Archive.org这样专门记录互联网数据的网站,所以即便Uber官方很快就删除了原文,我们仍能在网上看到这份“一夜情地图”。

  如果Uber的推断靠谱,那波士顿恐怕就是美国一夜情圣地了。根据Uber的数据,有1%的Uber用车订单符合这种在道德层面值得商榷的“荣耀之旅”模式。

  而纽约人则显得比较拘谨。“一夜情”的比率比波士顿低百分之八十。

  一夜情最频发的时间是周五和周六。

Uber德国总裁做出辩解

  对于这份有争议的分析报告,Uber德国总裁法比安·耐斯特曼(Fabien Nestmann)辩解,这份基于用户数据的性行为报告只是一个“数据分析的小游戏”,并为Uber大范围抓取用户数据的行为辩护。

  电视杂志《Panorama》在1月8日就此报道时打出的标题是“美丽新世界:分享的代价”,以此反思所谓的“共享经济”(Sharing Economy)带来的隐患。

  耐斯特曼对《Panorama》的报道回应道:“我们可以通过整体评估做出决策,以改善服务。这是Uber必须且将来也要一直做的事情。”至于为什么将之前的博客内容删除,他表示是应客户的要求。将来Uber将集中精力做那些“更有意义的分析”。

  (译自《世界报》,Power by)

  同样类似的事情放在中国,似乎并没有那么强烈的反弹。

  接近一年前,2014年2月9日上午,央视报道了对东莞色情场所的暗访节目,当晚,东莞全面清查全市娱乐场所。

  东莞扫黄一时间在微博和微信上掀起讨论高潮。一些人发微博说,有大量的东莞性工作者连夜离开东莞跑到香港去,可资佐证的是一张基于大数据的分析图。

  除夕夜和春运期间,央视《新闻联播》曾引用百度迁徙的大数据,去年这次央视对东莞色情业的暗访,再次让百度迁徙的大数平台瞬间火了一把。

  点燃这把火的,是一张来自百度大数据平台百度迁徙的数据截图。图片内容显示,在2月9日23点之前的8小时内,百度迁徙平台上显示东莞人群迁移的主要城市名单。

  来自新闻观止的分析称,在8个小时内,长途迁出东莞人口最多的城市排名分别是:香港、赣州、衡阳、宁波、梧州、漳州、上海、武汉、北京、青岛。

  很多人用“逃离东莞”作为调侃,来给这张图配说明。在微博上,还有人说,百度迁徙的这张图片表明,扫黄大扫帚把性工作者赶到香港等几个城市。

  这其实是一种误读。扫黄是从2月9日开始的,但在1月26日之前,大量人群从东莞迁移到北京、上海、武汉和青岛等一线城市。

  自1月26日开始,两周期间,一直有大量人群从东莞迁移到香港、郴州、赣州、宁波和漳州等几个城市。可见,不能单纯的凭2月9日的百度迁徙图,就得出有大量的性工作者“逃离”到香港、郴州、赣州、宁波和漳州。

  拥有八百多万人口的东莞,它8小时的人口流动,跟色情行业的关联度其实并没有那么高。越临近春节,从东莞迁移到周边省份二三线城市的人越多。这跟东莞的整个经济结构是有关的——东莞大量的制造业,劳动力来自江西、湖南和湖北等周边省份的农民工,这些农民工需要返乡,过完春节再回东莞。每年都像候鸟一样迁徙。

  这里再解释一下百度迁徙,百度地图春节人口迁徙大数据(简称百度迁徙)是百度在2014年春运期间推出的一项技术项目。百度迁徙利用大数据,对其拥有的LBS大数据进行计算分析,采用的可视化呈现方式,动态、即时、直观地展现中国春节前后人口大迁徙的轨迹与特征。

  百度迁徙本来的意义是为了记录和呈现春运人口迁徙状况,却歪打正着遇上了CCTV东莞事件,因而被解读成了“嫖客跑路示意图”。

  从上述时间点孤立地看,上述结论当然可以成立,但是从CCTV曝光之前的东莞春节人口迁徙来看,东莞相对平静的初六和风波骤起的初十迁徙数据没有什么大的区别。

  反倒需要注意的是,百度迁徙的数据来源是来自百度地图,而千万上亿级别的手机位置数据则被百度掌握,你我他可能都是这以大数据项目的贡献者,不管你是否自愿。这个移动互联网时代,联网,或许意味着被跟踪着。

  百度这款基于大数据的迁徙图产品所使用的数据是批量化、去中心化的数据,呈现的是群体性运动趋势而不是个体行为。LBS领域专家认为,此次东莞事件引发对百度地图的误读,其实源于大众对大数据技术的不了解所,大数据与用户隐私数据完全是两个概念。

  从技术层面上来说,百度迁徙涉及到的定位数据并非直接来源于用户,而是来源于采用百度地图LBS定位服务的数十万个APP应用。这些APP应用由数万开发者提供,也就是说,百度迁徙使用的相关数据都是批量化、去身份化的数据,不会与人的真实身份相对应;其次从百度迁徙的产品特征上来说,百度迁徙关注的是群体性趋势,而不是个体行为,因此在用户使用过程中并不会涉及公众的个人隐私问题。

原文发布于微信公众号 - PPV课数据科学社区(ppvke123)

原文发表时间:2015-01-26

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏VRPinea

将爱情熔铸于舞蹈与音乐,个人自制VR版《爱乐之城》不输电影原片

384100
来自专栏专知

两院院士评选2017年中国、世界十大科技进展新闻揭晓

2017年12月31日,由中国科学院、中国工程院主办,中国科学院学部工作局、中国工程院办公厅、中国科学报社承办,中国科学院院士和中国工程院院士投票评选的2017...

35560
来自专栏腾讯社交用户体验设计

ISUX文化创意海报设计大赛 - 腾讯ISUX

25530
来自专栏顶级程序员

最值得一读的20大科技名言

科技的进步通常会在各行各业的人中引发不同的情绪反应。有人认为科技是大恶魔,正慢慢减少我们的人性;其余人则认为科技让世界更紧密地联系起来,帮助解决我们面临的最大挑...

12330
来自专栏机器人网

2014年最炫的十大科学成就

预测哪个科学发现能改变未来世界,说实话,是个愚蠢的游戏。谁知道未来会怎样?然而,每年都有那么一大串新发现,比如最快最便宜的基因组编辑工具的到来,让我们激动得不能...

39260
来自专栏玉树芝兰

创新可以教吗?

学院让青年教师参加“创新教练训练营”。我散会后直接找领导说了我的疑惑——在我看来,创新是没办法教的。

11120
来自专栏PPV课数据科学社区

全世界最前沿的125个科学问题

简单归纳统计这125个问题,其中涉及生命科学的问题占46%,关系宇宙和地球的问题占16%,与物质科学相关的问题占14%以上,认知科学问题占9%。其余问题分别涉及...

15620
来自专栏华章科技

上清华到底有多难?清华大学保送生的数学试题了解一下

导读:前两天,数据叔刷到一张图,据称是2013年的清华保送生考试题。数据叔也懒得考证这张图的真假,但还是怀着一颗不知深浅的好奇心想挑战一下这几道题。然后……

29340
来自专栏钱塘大数据

Science公布:全世界最前沿的125个科学问题

在庆祝Science创刊125周年之际,Science公布了125个最具挑战性的科学问题。了解前沿科学研究方向,对你的成长或许有所帮助。简单归纳统计这125个问...

26620
来自专栏VRPinea

VR题材新剧《Kiss Me First》|技术本身没有“原罪”,关键是要应用得法

水能载舟亦能覆舟,火能取暖亦能成灾。新技术确实会改变生活——但这种改变可以是正向的,也可能是反向的。

14220

扫码关注云+社区

领取腾讯云代金券