业界 | 担心隐私泄露?微软亚洲研究院发布PrivTree项目保你安全

2011 年微软进行的一项调查显示,有 94% 的用户认为基于地理位置的服务具有价值。但是调查中也显示,52% 的人也关注与使用地理位置数据有关的隐私问题。

我们在生活中使用 GPS、IP 地址及 Wi-Fi 获取基于位置的服务,实现实时导航、本地天气、地理定位的功能,但在无形之中,它也泄露了我们的隐私。

此前数据科学家 Anthony Tockar 在西北大学读研究生时,就采用可公开获取的位置数据,通过交叉参考公共新闻与照片,跟踪位于纽约市的名人。

隐私问题已经成为了研究界所关注的焦点,南洋理工大学的萧小奎表示,「现在的计算能力与公开数据的规模可以使我们更容易地从数据中识别对方。」

AI 科技评论消息,日前萧教授与微软亚洲研究院的谢幸博士已经发现了一种可以缓解隐私问题的一种方式。这种名为 PrivTree 的数据操作技术能对地理位置数据进行预处理,以保障个人隐私。随后,这些已经进行过隐私处理的数据可以安全地应用于任何预测分析,而不会对隐私造成进一步风险。

PrivTree 的原理是通过数学方法的「模糊」(blurring) 对地理信息进行处理,但保持整个数据集的总体准确性。以下图为例,数据集里的个体在地图上呈现各自的坐标。

接下来,PrivTree 通过两个步骤对地理位置信息进行模糊处理。

  • 地图分区 (Map Partitioning),也就是基于数据点的密度,将图片分割成若干区域。
  • 位置扰动 (Location Perturbation),即采用统计分析方法,个体受扰动方案随机被摸除、添加或混洗以保证隐私及统计的准确性。在对每个子区域的应用位置扰动后,新的地理位置数据库最终形成。

这些新数据点遵循与原始数据类似分布,但每个个体的真实位置被掩盖了。这些被处理过的数据可以做为 PrivTree 的数据释出。而这个数据集能够拓展为支持各类位置数据的应用——比如你每天的慢跑路线会上传到健康应用程序。具体论文《PrivTree: A Differentially Private Algorithm for Hierarchical Decompositions》已经被 ACM SIGMOD 2016 收录。

萧教授表示,「微软亚洲研究院在管理海量地理位置数据上有着丰富经验,比如北京出租车数据等。这些数据能够帮助我们开发测试我们的模型。」他计划进一步将 PrivTree 技术集成到微软基于位置的服务里,为用户提供隐私保护。

「数据隐私是云计算时代所面临的一个关键挑战,尤其是对于包含大量个人信息的用户生成的位置数据。我们希望这项合作能够为所有人建立一个更加安全的世界,」谢幸博士表示。

当然,AI 科技评论也同样期待这项技术能早日应用于实际领域。

via microsoft

原文发布于微信公众号 - AI科技评论(aitechtalk)

原文发表时间:2017-01-23

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏Hadoop实操

刘汨春:AI大数据在企业全链业务中的应用和价值(上)

AI和数据科学就像硬币的两面,AI是从背面去看,数据科学是从正面去看。只要从数据中能得到智慧的科学,就是数据科学。AI理论有两条主线,第一条主线是浅层学习,或者...

662
来自专栏AI科技大本营的专栏

2016:深度学习独领风骚的一年

作者: CADE METZ 编译: AI100 原文地址: https://www.wired.com/2016/12/2016-year-deep-lear...

32814
来自专栏灯塔大数据

干货|AI、大数据和数据科学的10类算法, 以及它们擅长的任务

AI正在改变我们的职业、我们的工作方式和我们的企业文化。AI让我们得以专注于那些真正关键的技术,让人力资源得以充分发挥他们的长处。但在工作场景中应用AI确实会...

3348
来自专栏AI科技评论

洞见 | 专访中科创达王璠:怎样做好嵌入式人工智能的算法开发?

目前在人工智能领域,不管是学术圈还是工业圈,大家都认同一个趋势,那就是在很多应用场景上计算需要落地到设备上,让设备拥有智能化——即嵌入式的AI,这个是人工智能领...

3469
来自专栏机器之心

英伟达GTC中国站开幕:宣布TensorRT3、自动机器处理器Xavier

机器之心报道 参与:李泽南 9 月 26 日上午,英伟达 GTC 大会中国站在北京开幕。作为每年 GPU 开发者最为重要的盛会,GTC 和全球一系列活动为开发者...

2629
来自专栏大数据文摘

行业 | 我的数据科学成果为什么无法商业化?

1124
来自专栏AI科技评论

大会 | 智能时代安全领域的巨变,从反欺诈、汽车、主机到法律

AI 科技评论按:3 月 30 日 - 31日,AITech 峰会在深圳龙岗区成功举办。

824
来自专栏大数据文摘

Teradata CTO:将筛选数据的时间用来决策,机器学习如何改变商业决策模式

1904
来自专栏BestSDK

如何利用大数据进行预测性营销,看完这8个深度解答你就懂了

1、什么是精准营销,预测营销? 说到精准营销,不得不先提个性化的用户画像,我们针对每一类数据实体,进一步分解可落地的数据维度,刻画他/她的每一个特征,在聚集起来...

4434
来自专栏机器之心

这家公司正在影响大公司决策,还开发了一款机器学习优化引擎

机器之心原创 作者:虞喵喵 「人工智能会提供偏早期的功能,比如从数据到规律。在规律之后,从规律到决策是运筹学的范畴。」 在斯坦福运筹学博士、杉数科技联合创始人...

3388

扫描关注云+社区