业界 | 担心隐私泄露?微软亚洲研究院发布PrivTree项目保你安全

2011 年微软进行的一项调查显示,有 94% 的用户认为基于地理位置的服务具有价值。但是调查中也显示,52% 的人也关注与使用地理位置数据有关的隐私问题。

我们在生活中使用 GPS、IP 地址及 Wi-Fi 获取基于位置的服务,实现实时导航、本地天气、地理定位的功能,但在无形之中,它也泄露了我们的隐私。

此前数据科学家 Anthony Tockar 在西北大学读研究生时,就采用可公开获取的位置数据,通过交叉参考公共新闻与照片,跟踪位于纽约市的名人。

隐私问题已经成为了研究界所关注的焦点,南洋理工大学的萧小奎表示,「现在的计算能力与公开数据的规模可以使我们更容易地从数据中识别对方。」

AI 科技评论消息,日前萧教授与微软亚洲研究院的谢幸博士已经发现了一种可以缓解隐私问题的一种方式。这种名为 PrivTree 的数据操作技术能对地理位置数据进行预处理,以保障个人隐私。随后,这些已经进行过隐私处理的数据可以安全地应用于任何预测分析,而不会对隐私造成进一步风险。

PrivTree 的原理是通过数学方法的「模糊」(blurring) 对地理信息进行处理,但保持整个数据集的总体准确性。以下图为例,数据集里的个体在地图上呈现各自的坐标。

接下来,PrivTree 通过两个步骤对地理位置信息进行模糊处理。

  • 地图分区 (Map Partitioning),也就是基于数据点的密度,将图片分割成若干区域。
  • 位置扰动 (Location Perturbation),即采用统计分析方法,个体受扰动方案随机被摸除、添加或混洗以保证隐私及统计的准确性。在对每个子区域的应用位置扰动后,新的地理位置数据库最终形成。

这些新数据点遵循与原始数据类似分布,但每个个体的真实位置被掩盖了。这些被处理过的数据可以做为 PrivTree 的数据释出。而这个数据集能够拓展为支持各类位置数据的应用——比如你每天的慢跑路线会上传到健康应用程序。具体论文《PrivTree: A Differentially Private Algorithm for Hierarchical Decompositions》已经被 ACM SIGMOD 2016 收录。

萧教授表示,「微软亚洲研究院在管理海量地理位置数据上有着丰富经验,比如北京出租车数据等。这些数据能够帮助我们开发测试我们的模型。」他计划进一步将 PrivTree 技术集成到微软基于位置的服务里,为用户提供隐私保护。

「数据隐私是云计算时代所面临的一个关键挑战,尤其是对于包含大量个人信息的用户生成的位置数据。我们希望这项合作能够为所有人建立一个更加安全的世界,」谢幸博士表示。

当然,AI 科技评论也同样期待这项技术能早日应用于实际领域。

via microsoft

原文发布于微信公众号 - AI科技评论(aitechtalk)

原文发表时间:2017-01-23

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏光变

成功项目管理的七条原则和三十个秘诀

美国著名软件工程专家勃姆(B.W.Boehm)在总结软件工程准则和信条的基础上,于1983年提出软件…

1172
来自专栏ATYUN订阅号

【行业】Linux Foundation推出LF深度学习基金会来加速AI的发展

AiTechYun 编辑:nanan ? Linux基金会启动了LF深度学习基金会,这是一个专注于AI、机器学习和深度学习提供开源创新的综合性组织。LF深度学习...

3717
来自专栏小詹同学

Python 新手玩家都应该知道的编程技巧 !

大佬 ,我是一个小白 ,很想学习 Python ,它能做些什么啊 ?您这边有什么好的入门建议吗 ?

1332
来自专栏腾讯大讲堂的专栏

【移动可用性测试 ②】移动情境问题探讨

作者:徐沙,心理学硕士,从事用户研究工作多年,喜欢寻找复杂行为背后的简单规则。 本篇主要讨论两个问题: 1、移动情境在移动可用性测试中的考虑 2、使用测试设备还...

2376
来自专栏数据的力量

数据分析那些事(菜鸟入门必看)

3735
来自专栏大数据文摘

从产品设计到虚拟现实:Google虚拟现实团队设计师和你聊VR

2104
来自专栏java一日一条

五分钟重温C#委托,匿名方法,Lambda,泛型委托,表达式树

到现在我已经专业地构建软件超过10年时间了。我热爱我的工作,并且我希望能在这一行一直干到成为老程序员的那一天。一路走来,我遇到过很多可怕的事情,让我觉得我的工作...

1702
来自专栏java一日一条

让程序员/技术主管/项目经理最可怕的事情是什么?

到现在我已经专业地构建软件超过10年时间了。我热爱我的工作,并且我希望能在这一行一直干到成为老程序员的那一天。一路走来,我遇到过很多可怕的事情,让我觉得我的工作...

1571
来自专栏无原型不设计

使用Mockplus的九大理由

简洁高效,是它的主要产品特点。 关注设计,而非工具,是它带给设计人员的理念。 1.不为工具所累,关注设计而不是工具 Mockplus超级简单,但是功...

3013
来自专栏PPV课数据科学社区

【推荐】更多数据……巨多数据……大数据!

如果你所在的企业正在利用大数据支撑运营型分析工作,本章讲的正是这时你需要掌握和了解的那些关乎大数据的重要趋势。过去的许多年间,企业积累的数据越来越多。尤其是到了...

3016

扫码关注云+社区

领取腾讯云代金券