前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >大数据与个人隐私的平衡:懂你,但不认识你

大数据与个人隐私的平衡:懂你,但不认识你

作者头像
数据猿
发布2018-05-31 15:41:03
1.2K0
发布2018-05-31 15:41:03
举报
文章被收录于专栏:数据猿数据猿数据猿

【数据猿导读】Facebook 泄露5000万用户数据的事情余波未消,李彦宏一句“中国人愿意用隐私换便利”再掀波澜,近日,支付宝因三项违规被罚18万其中一条也是“个人金融信息使用不当”。为何数据泄露事件屡发不止?大数据技术与个人隐私之间的矛盾真的就不可调和吗?大数据时代我们真的都是透明人吗?

记者 | 小北

官网 | www.datayuan.cn

微信公众号ID | datayuancn

自大数据技术兴起之始,关于数据隐私的争论就从未平息。

Facebook 泄露5000万用户数据的事情余波未消,李彦宏一句“中国人愿意用隐私换便利”再掀波澜,近日,支付宝因三项违规被罚18万其中一条也是“个人金融信息使用不当”。

为何数据泄露事件屡发不止?大数据技术与个人隐私之间的矛盾真的就不可调和吗?大数据时代我们真的都是透明人吗?

其实不然。

隐私换便利没有错,前提是知情与允许

李彦宏一句“中国人愿意用隐私换便利”在媒体的推波助澜下被万众谴责,然而大家只知其一,不知其二。李彦宏这句话的下一句是:“当然我们也要遵循一些原则,如果这个数据能让用户受益,他们又愿意给我们用,我们才会去使用它。而这个原则带入到用户的角度,那就是要在用户知情、允许的前提下,变向地用隐私换取服务。”

当局部变得完整,细细品味,其实此言不无道理。

因为我们每个人,都曾用“隐私换便利”。比如,为了吃到外卖,必须把自己的联系方式与家庭住址让渡出去;为了打车,必须把你所在的实时位置让渡出去;为了看病,必须把自己的病历信息让渡出去;为了看自己喜欢的资讯,必须把自己的浏览记录让渡出去……

这些行为之所以不违法,是因为用户知情,并且允许。而Facebook利用“性格测试”的幌子,让27万用户在不知情的前提下提交了自己身份信息和社交信息,并通过这27万用户获取了他们超过5000万的社交好友资料,最后转交给剑桥分析。在这个过程中,所有用户都不知情,更谈不上允许,并且还存在诱导欺诈行为。如果Facebook从最开始就明确告知用户收集信息的目的,并经用户同意后再行处理,那么扎克伯格就不用亲赴国会面对众人质询了。

知情与允许是企业获取用户数据的前提,但让用户知情并心甘情愿允许却并非易事。所谓上有政策,下有对策,各大企业为了获取这宝贵的“允许”可谓花样百出,各显神通。虽然此次支付宝个人金融信息使用不当的具体细节未披露,但去年年底支付宝账单默认勾选“同意芝麻服务协议”的“愚蠢行为”想必大家还记忆犹新,更别提普天之下有多少APP实行“强制允许”——不允许无法使用。

难道要想获得便利、高效的互联网服务,我们真的必须穿上“皇帝的新装”,做个没有隐私的“透明人”吗?

其实不然,江湖混战,还需遵“道”。此“道”为法。目前,我国关于数据隐私的立法,已经初步启动。

多层立法模式确保剑柄握在用户自己手里

大数据立法的前提在于厘清隐私保护的边界以及个人数据的归属权。

从网络实践来看,网络隐私包括用户的身份信息和网络行为数据。网络身份信息涵盖用户实名身份信息、注册信息和虚拟地址信息等足以精准到个人信息的数据,在法律性质上属于传统隐私权涵盖范围。至于网络行为产生的数据信息,因直接或间接都无法精确到自然人,所以其法律性质更像是知识产权。

2017年6月1日起正式实施的《网络安全法》第76条明确规定了法律保护的个人信息范围,即“单独或者与其他信息结合识别自然人个人身份的各种信息”。除此之外的数据信息即行为数据,属于大数据性质,不在隐私权保护体系范围之内。

根据这一法律逻辑,我国初步建立起了对隐私保护的三层立法模式:

第一层,自然人的姓名、身份证件号码、电话号码等敏感的身份信息是法律保护最高等级,任何人触犯都将受到刑事法律最严格的处罚。这一点要求大数据企业未经用户允许不得采集、使用和处分具有可识别性的身份信息。

第二层,对于除个人身份信息之外的不可识别的数据信息,按照商业规则和惯例,以“合法性、正当性和必要性”的基本原则进行处理。这一点确保大数据企业即便在征求用户同意之后,也不得违反法律规定过度化使用不可识别的数据信息。支付宝此次被罚其中一条就是“个人金融信息收集不符合最少、必需原则”。

第三层是明确个人数据控制权。《网络安全法》明确规定数据控制权是人格权的重要基础性权利。Fackbook数据泄露事件正好强化了公众的数据保护意识,大数据企业应该从技术和制度两方面,保证用户充分享有对自己数据的知情权、退出权和控制权,确保剑柄握在用户手中。在此方面,欧盟曾推出“被遗忘权”,允许用户从搜索引擎结果页面中删除自己的名字或者相关历史事件。

大数据企业让数据懂你但不认识你

除了国家立法层面,大数据企业也应该遵守一定的规范,积极主动地保护用户隐私。

首先,大数据公司只能收集为我们提供特定服务所必需的特定数据。打车或外卖软件只能要求用户提供实时位置和电话号码,而不能收集用户的身份证号码等其他不相关信息,修图软件可以收集用户的图片信息而不能要求用户提供文章信息。

对于经用户允许收集来的信息,大数据企业也必须保证不能错用、滥用。除此之外,大数据企业也有责任保护用户隐私数据不为第三方窃取或滥用。比如我们的就诊信息被医药公司窃取,那么医院必须承担相应的责任。此次Facebook引起公愤,正是因为其数据被剑桥分析窃用,没有尽到保护的职责。

除了统一的使用规范,大数据公司还可通过数据脱敏的技术手段来保护个人隐私。数据脱敏是指对某些敏感信息通过脱敏规则进行数据的变形,实现敏感隐私数据的保护。即将用户的个人信息在企业内部以匿名化方式存储,比如淘宝可以在储存你的浏览记录时匿去个人身份信息,这样它就能在不侵犯你隐私的情况下给你推荐喜欢的商品,懂你,但不认识你。

“懂你,但不认识你。”这便是大数据发展与个人隐私之间的一个平衡点,是数据生命周期中的最好状态。

掌握着大量数据的企业,首先应该做的便是利用技术把握好这个平衡点,而非一心利用数据追求商业价值。只有突破了数据隐私保护的瓶颈,大数据企业才能迎来真正的春天。(文/小北)

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2018-04-24,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 数据猿 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
大数据
全栈大数据产品,面向海量数据场景,帮助您 “智理无数,心中有数”!
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档