大数据和隐私:政府必须选择!(上)

大数据文摘翻译:Alex Wong,盛夏光年 校对:yawei xia (转载请保留)

在去年第一次被卷入斯诺登揭秘的争议后,总统奥巴马曾表态他欢迎来一场关于隐私的“对话”,虽然这样有点马后炮的意味。你可能对美国的间谍行为嗤之以鼻,但这场民众和联邦政府间的对话已经开始。三个公众研讨会的第一站就在3月10日于麻省理工举行。

研讨会现场,讨论的重点聚焦在隐私的科技层面。发言者首先肯定了数据的价值(多次提及“大数据”这一时髦词), 说明了收集有用数据和保护个人隐私之间的权衡问题,还介绍了可以分析加密数据且同时不会暴露个人信息的最新技术。另外两个研讨会将在其他两个城市举行,分别关注数据使用的道德和法律层面的问题。

作为一个涉足黑客领域经常听闻新技术对个人隐私的侵犯的人来说,我认为这场会议所讨论的话题范围令人失望。台面上大家达成的共识是被收集的个人信息就如挤出来的牙膏不可能再退回去一样,我们能做的就是提高自己的空腔卫生。许多人都同意这种传统的观点:个人数据挖掘和隐私保护是相对立的。但有些人仍保有希望,他们认为科技的进步将能够为数据分析和个人信息保护的对立关系找到和解方式。

没有人认识到其实我们可以管理自己的数据并且有选择地与别人分享,这正是“卖家关系管理运动”(Vendor Relationship Management movement)和很多医疗改革者提倡的。正如一位听众指出,没有人想到要解决如何阻碍个人数据被收集的技术问题,如洋葱路由器(The Onion Routing,这是一款由美国海军赞助的网络匿名交流软件)。

尽管发言人承认数据分析可能会有意无意地掌控我们的生活,对我们个人造成不利影响,但他们几乎都没有提及数据分析的群体性影响。

研讨会最终,发言人顺便提到了物联网(Internet of Things)和在这个社交时代保护隐私的困难,他们并未强调未来几年将会充斥互联网上的信息爆炸。而这将改变我们分析利用个人数据的大环境,不论是改善我们生活的那一方面,还是给我们造成麻烦的那一方面,都会被改变。

讨论组一个成员警告说越来越多关于我们的数据不直接来源于我们自己。我觉得现在还没到这步,但可能很快就会发生。波士顿全球(The Boston Globe)不久前曾报道称一个巨大的车辆监控网络是由私人企业运行的,美国宪法第四修正案赋予了他们这一自由。一旦人们能通过他们走路的方式被监控识别出来,隐私便无从谈起了。但,我还没打算放弃数据收集。

政府正在问自己和公众的问题

曾任克林顿和奥巴马政府核心顾问的约翰.普代斯塔(John Podesta)在它的航班因寒流滞留后通过电话向我们发表过演讲。他引用了总统奥巴马今年1月17日发表的一篇(关于限制国家安全局监听权利的)重要演讲,称他自己正带领一个工作小组来促进一个“开放,彼此协作,安全且可靠的互联网”的达成。

然而如果由于斯诺登的揭秘而把政府对个人隐私的管理行为都加以谴责未免太过于草率了。事实上政府几年来一直试图劝服企业升级个人信息安全系统,并已与普代斯塔的工作小组同时期发布了一项网络安全计划。联邦机构一直在考虑促进更多的网上合作,保护网民的隐私安全,这通过国家标准技术研究所运行的“全国互联网可信身份国家战略”(National Institute of Standards and Technology)项目就可以看出。

隐私和个人数据分析的关系可能现在还不是那么清晰,但仔细研究两者中任何一个势必会涉及到另一个。这一理解再次验证了我曾经写的关于数据身份的一系列文章。

我们的自主权利面临的威胁并不止于政府监听。企业想知道我们的购买行为,保险公司希望知道我们将会遇到什么样的风险。麻省理工教授山姆.曼登(Sam Madden)说手机上的感应器所收到的数据可以显示司机是否在做危险操作。他还说最危险的司机群体(即年轻男性)一般会减少78%的危险操作如果他们知道他们正在被这样监视。你对这做何感想?是打从心底里反感这种对一举一动的严密监控吗?但如果你自己的保险成本因为监控下降了,高速路上的事故伤亡也因此减少了,你又有何感想?

但是现在政府和企业还没有一个明确的界限。许多评论家抱怨一些大型互联网公司和国家安全局共享了他们收集到的用户信息。我也指出过是互联网的集中让政府监管成为可能。

有人揭露称国家安全局收集有关国际贸易的数据,虽然并没有直接证据显示这会影响贸易谈判,但这也不禁让人怀疑政府间谍们是否把反恐作为其他商业利益的挡箭牌,尤其是当他们把监听触角伸向了德国、巴西等同盟国领导的手机上时。

普代斯塔说现在是时候重新翻开引导了美国和许多其他国家几十年立法的“公平资讯实务”(Fair Information Practice)。他也承认对当今法律最大的挑战是我们对于隐私的理解:从可预知的搜索到非预知搜索或模式搜索的转变。这句话可以这样理解:搜索一个预知的结果可以是一个简单的数据库查询语句来验证一组你想要找到的关联,比如预定酒店的人是否也会预定租车。一个非预知的搜索将会是完全无法预计的关系,比如最著名的例子便是某超市通过对消费者做数据分析预知了一个女孩的怀孕。

普代斯塔让我们思考的是大数据有何不同,企业依靠大数据可以建立什么样的商业模型,大数据有什么用途,我们是否需要在数据分析中研究隐私保护。最后,普代斯塔承诺三个月后将出一份强化隐私保护法律的报告。

那天晚些时候,美国商务部秘书长Penny Pritzker进一步提出了一些问题:企业应该采取怎样的信任原则?数据中的隐私保护该怎样改善?政府应该如何变得更加可靠和信息透明?消费者应该怎样知道他们正在和谁分享着什么信息?政府和企业应该如何降低大数据对人们产生的不可预料的伤害?

动机和诱惑

早晨的讨论组大力称赞了数据分析的价值,同时也表达了对隐私保护的担忧。讨论组成员来自各行各业,有医药、基因研究、运输业和教育业。他们对数据分析价值的兴奋态度很有感染力,以至于来自麻省理工计算机科学和人工智能实验室的莎菲.高登瓦瑟(Shafi Goldwasser)也开玩笑说他几乎想说“快来拿我的数据吧!”

我认为在讨论组成员选择的背后是一张许给我们美好未来的日程表, 某一天我们将不再需要绕很多圈子找停车位,我们能更好地选择大学开设的课程,甚至我们可以通过数据分享治愈疾病。相反的,那些在社交网站靠窃取私人信息来帮保险公司推脱保险责任的人不在讨论组里,而且他们以后要获取数据会更困难。他们的存在让我们注意到了以数据窃取为目的的欺骗性引诱的存在。大数据向我们展现了各种不可思议的可能性。统计学家能够在巨大样本中发现联系,给人们提供有用的建议。但如果仅通过数据分析建立的那套标准来评判每个人,这就是一种纯粹的偏见,这有可能导致对分析结果的滥用,比如因为学生发了一张自己在聚会时候的照片就给他贴上放荡淫乱的标签,或者因为某个人在社交网站吹嘘他的体能就撤回他的残疾保险。

文章未完,下部更精彩,本周继续发布:

鱼与熊掌可以兼得

…..

隐私与尊严

…..

摘自O’Reilly Radar博客(《隐私的技术问题》)

原文发布于微信公众号 - 大数据文摘(BigDataDigest)

原文发表时间:2014-05-14

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏镁客网

谷歌回归中国选择了网易这块敲门砖,然而恐怕还是来迟了

1743
来自专栏腾讯研究院的专栏

信息超新星的诞生

image.png 推荐语: “信息能”这个提法让人耳目一新,它是信息革命的核心能源。正如蒸汽机推动了工业革命一样,“信息能”则推动了全球三十年来之...

19210
来自专栏VRPinea

奥英VR Big Show打响CJ第一枪,黑洞大空间VR全面曝光

3626
来自专栏罗超频道

百度整改动真格,搜索引擎行业会拐点将至?

2016年上半年百度麻烦缠身。贴吧门、魏则西事件、夜间推广赌博网站等坏消息接踵而至,百度被置于舆论漩涡,网信办《互联网信息搜索服务管理规定》和工商总局《互联网广...

3075
来自专栏VRPinea

VR影片《Spheres》被卖出140万美元,或成圣丹斯上第一次大规模VR电影收购

3635
来自专栏钱塘大数据

三大手术,工业互联网让工厂脱胎换骨

导读:  工业互联网是一场脱胎换骨式的产业革命。现在,人类工厂正在接受换身、换头和换肢的手术,手术完后,摇身一变,就变成了智慧工厂,在智慧工厂里,人族、机器人...

3116
来自专栏大数据文摘

【基因有话说】医疗数据到底该不该公开?

1464
来自专栏机器人网

2014年最值得感谢的14个科技趋势

周四是美国传统节日感恩节,周五便是黑色星期五,圣诞节也很快就要到来,2014年马上就要过去。美国科技博客TechCrunch回顾了这一年科技行业的发展,选出了2...

2685
来自专栏云市场·精选汇

小程序+餐饮如何让生意火起来?

在小程序出现以后,很多线下实体店商家嗅到了其中蕴藏的无限商机,尤其是线下的餐饮行业。自从2017年1月9日微信小程序发布以后,餐饮业小程序动作频繁,比如肯德基、...

4775
来自专栏科技向令说

响铃:Don't be evil?Google别闹了

刚刚被欧盟贴了巨额罚单的Google又开心起来。美国时间7月23日,谷歌母公司Alphabet公布了2018年二季度财报,总营收326.57亿美元,同比增长26...

743

扫码关注云+社区

领取腾讯云代金券