专栏首页数据猿大数据与个人隐私的平衡:懂你,但不认识你

大数据与个人隐私的平衡:懂你,但不认识你

【数据猿导读】Facebook 泄露5000万用户数据的事情余波未消,李彦宏一句“中国人愿意用隐私换便利”再掀波澜,近日,支付宝因三项违规被罚18万其中一条也是“个人金融信息使用不当”。为何数据泄露事件屡发不止?大数据技术与个人隐私之间的矛盾真的就不可调和吗?大数据时代我们真的都是透明人吗?

记者 | 小北

官网 | www.datayuan.cn

微信公众号ID | datayuancn

自大数据技术兴起之始,关于数据隐私的争论就从未平息。

Facebook 泄露5000万用户数据的事情余波未消,李彦宏一句“中国人愿意用隐私换便利”再掀波澜,近日,支付宝因三项违规被罚18万其中一条也是“个人金融信息使用不当”。

为何数据泄露事件屡发不止?大数据技术与个人隐私之间的矛盾真的就不可调和吗?大数据时代我们真的都是透明人吗?

其实不然。

隐私换便利没有错,前提是知情与允许

李彦宏一句“中国人愿意用隐私换便利”在媒体的推波助澜下被万众谴责,然而大家只知其一,不知其二。李彦宏这句话的下一句是:“当然我们也要遵循一些原则,如果这个数据能让用户受益,他们又愿意给我们用,我们才会去使用它。而这个原则带入到用户的角度,那就是要在用户知情、允许的前提下,变向地用隐私换取服务。”

当局部变得完整,细细品味,其实此言不无道理。

因为我们每个人,都曾用“隐私换便利”。比如,为了吃到外卖,必须把自己的联系方式与家庭住址让渡出去;为了打车,必须把你所在的实时位置让渡出去;为了看病,必须把自己的病历信息让渡出去;为了看自己喜欢的资讯,必须把自己的浏览记录让渡出去……

这些行为之所以不违法,是因为用户知情,并且允许。而Facebook利用“性格测试”的幌子,让27万用户在不知情的前提下提交了自己身份信息和社交信息,并通过这27万用户获取了他们超过5000万的社交好友资料,最后转交给剑桥分析。在这个过程中,所有用户都不知情,更谈不上允许,并且还存在诱导欺诈行为。如果Facebook从最开始就明确告知用户收集信息的目的,并经用户同意后再行处理,那么扎克伯格就不用亲赴国会面对众人质询了。

知情与允许是企业获取用户数据的前提,但让用户知情并心甘情愿允许却并非易事。所谓上有政策,下有对策,各大企业为了获取这宝贵的“允许”可谓花样百出,各显神通。虽然此次支付宝个人金融信息使用不当的具体细节未披露,但去年年底支付宝账单默认勾选“同意芝麻服务协议”的“愚蠢行为”想必大家还记忆犹新,更别提普天之下有多少APP实行“强制允许”——不允许无法使用。

难道要想获得便利、高效的互联网服务,我们真的必须穿上“皇帝的新装”,做个没有隐私的“透明人”吗?

其实不然,江湖混战,还需遵“道”。此“道”为法。目前,我国关于数据隐私的立法,已经初步启动。

多层立法模式确保剑柄握在用户自己手里

大数据立法的前提在于厘清隐私保护的边界以及个人数据的归属权。

从网络实践来看,网络隐私包括用户的身份信息和网络行为数据。网络身份信息涵盖用户实名身份信息、注册信息和虚拟地址信息等足以精准到个人信息的数据,在法律性质上属于传统隐私权涵盖范围。至于网络行为产生的数据信息,因直接或间接都无法精确到自然人,所以其法律性质更像是知识产权。

2017年6月1日起正式实施的《网络安全法》第76条明确规定了法律保护的个人信息范围,即“单独或者与其他信息结合识别自然人个人身份的各种信息”。除此之外的数据信息即行为数据,属于大数据性质,不在隐私权保护体系范围之内。

根据这一法律逻辑,我国初步建立起了对隐私保护的三层立法模式:

第一层,自然人的姓名、身份证件号码、电话号码等敏感的身份信息是法律保护最高等级,任何人触犯都将受到刑事法律最严格的处罚。这一点要求大数据企业未经用户允许不得采集、使用和处分具有可识别性的身份信息。

第二层,对于除个人身份信息之外的不可识别的数据信息,按照商业规则和惯例,以“合法性、正当性和必要性”的基本原则进行处理。这一点确保大数据企业即便在征求用户同意之后,也不得违反法律规定过度化使用不可识别的数据信息。支付宝此次被罚其中一条就是“个人金融信息收集不符合最少、必需原则”。

第三层是明确个人数据控制权。《网络安全法》明确规定数据控制权是人格权的重要基础性权利。Fackbook数据泄露事件正好强化了公众的数据保护意识,大数据企业应该从技术和制度两方面,保证用户充分享有对自己数据的知情权、退出权和控制权,确保剑柄握在用户手中。在此方面,欧盟曾推出“被遗忘权”,允许用户从搜索引擎结果页面中删除自己的名字或者相关历史事件。

大数据企业让数据懂你但不认识你

除了国家立法层面,大数据企业也应该遵守一定的规范,积极主动地保护用户隐私。

首先,大数据公司只能收集为我们提供特定服务所必需的特定数据。打车或外卖软件只能要求用户提供实时位置和电话号码,而不能收集用户的身份证号码等其他不相关信息,修图软件可以收集用户的图片信息而不能要求用户提供文章信息。

对于经用户允许收集来的信息,大数据企业也必须保证不能错用、滥用。除此之外,大数据企业也有责任保护用户隐私数据不为第三方窃取或滥用。比如我们的就诊信息被医药公司窃取,那么医院必须承担相应的责任。此次Facebook引起公愤,正是因为其数据被剑桥分析窃用,没有尽到保护的职责。

除了统一的使用规范,大数据公司还可通过数据脱敏的技术手段来保护个人隐私。数据脱敏是指对某些敏感信息通过脱敏规则进行数据的变形,实现敏感隐私数据的保护。即将用户的个人信息在企业内部以匿名化方式存储,比如淘宝可以在储存你的浏览记录时匿去个人身份信息,这样它就能在不侵犯你隐私的情况下给你推荐喜欢的商品,懂你,但不认识你。

“懂你,但不认识你。”这便是大数据发展与个人隐私之间的一个平衡点,是数据生命周期中的最好状态。

掌握着大量数据的企业,首先应该做的便是利用技术把握好这个平衡点,而非一心利用数据追求商业价值。只有突破了数据隐私保护的瓶颈,大数据企业才能迎来真正的春天。(文/小北)

本文分享自微信公众号 - 数据猿(datayuancn),作者:小北

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2018-04-24

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 大数据24小时 | 脉脉将征信系统引入职场社交;内蒙古500亿元投资发力大数据

    数据猿导读 数据管理解决方案提供商Informatica发布五款云服务产品;基于大数据技术的房屋增值服务平台“舍艺”获3000万元融资;键桥通讯拟9.45亿元收...

    数据猿
  • 包银消费金融总经理助理汤向军:消费金融行业的大数据

    数据猿报道,2017年10月25日,由 数据猿 联合《清华金融评论》共同主办的“2017金融科技价值峰会——数据驱动金融商业裂变”在北京隆重召开。本文为数据猿现...

    数据猿
  • 达观数据创始人陈运文:算法技术剖析海量数据,数据价值驱动企业收益

    在数据不断增加和算法技术日益优良的并行时代,借助技术去挖掘数据蕴藏的价值,利用数据蕴藏的价值去驱动企业的运营和发展,这是技术、数据、企业收益三者之间的良性循环,...

    数据猿
  • 「企业合规」开发符合GDPR标准的应用程序的15个步骤

    引入欧洲在线数据隐私法将对组织如何处理和管理其用户的个人数据产生重大影响。该法律于1月份通过,将于2018年全面颁布。对于定期处理为欧洲公民提供服务的客户或个人...

    首席架构师智库
  • 【应用】信用评分:第3部分 - 数据准备和探索性数据分析

    因此,**数据准备是任何数据挖掘项目的关键方面,包括信用评分卡的开发。 **这是CRISP-DM周期中最具挑战性和耗时的阶段。 项目总时间中至少70%,有时多于...

    陆勤_数据人网
  • 初志安全存储云解决方案

    初志安全存储云解决方案 方案概述 进入DT时代,随着设备的互联互通以及多网络的接入,数据越来越集中化,为了开发大数据应用,发掘潜在的数据价值,企事业单位多个部门...

    企鹅号小编
  • 云计算价值实现 忌醉翁之意不在“云”

    “如果还有哪个行业比服装界更赶潮流的话,那便非IT行业莫属了”,对于云计算在几年间迅速崛起,甲骨文CEO拉里·埃里森有此感概。数据显示,2013-2017年全球...

    静一
  • 人工智能工程师学习学习路线图

    1、度量模型是否成功的各种方法(精确度、召回率、ROC曲线下面积等)。损失函数和评估指标的选择是如何**偏离模型的输出**的。

    机器人网
  • 大数据和云计算硬币的正反面

    大数据和云计算硬币的正反面 “大数据也需要云计算这个平台,这是一个硬币的正反面。”阿里云总裁王文彬(花名:菲青)与媒体交流时表示。这几年IT行业发生了翻天覆地的...

    静一
  • 用大数据捉奸?算得上是大数据应用吗?

    你还不来,我怎敢老去 本文大概2040字,读完共需5分钟 一直想着写点关于当今大数据的看法,即便观点有些鼠目寸光,照例不怕大家对我嗤之以鼻,脸皮厚着呢。 首先来...

    企鹅号小编

扫码关注云+社区

领取腾讯云代金券