前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >随机响应 | 隐私保护模型

随机响应 | 隐私保护模型

作者头像
Defu Li
发布2019-01-23 15:36:01
1.5K0
发布2019-01-23 15:36:01
举报
文章被收录于专栏:斜述视角斜述视角

设想这样一个场景,一位专家来到你的学校,对着所有同学说:我是一位数据分析专家,我现在要统计你们的一些信息,但是我不会泄露你们的个人隐私,我也不会把这些数据交给公安部门。紧接着,他说道:我想要调查的问题是,你们每个大学生在校期间是否发生过性行为?

这时候,想必没有哪个发生过的大学生会真实的回答,这可是个人隐私,并且极为敏感的个人隐私。

那该怎么办,专家还想要得到真实的数据去研究,但是大学生在现有的隐私保护条件下不愿说出真相。有一个模型叫作随机响应模型,或许可以解决这个问题。

随即响应

调查问题:你是否在校期间发生过性行为?

被调查者,也就是学生,在回答该问题时采用抛硬币的方式,规则如下:

第一次抛硬币:

如果正面朝上,回答者实事求是回答问题。发生过Yes,没有发生过No。

如果反面朝上,回答者再抛一次硬币。

第二次抛硬币:

如果正面朝上,回答发生过Yes。

如果反面朝上,回答没有发生过No。

假设测试总人数N,回答Yes的总人数N*,真实发生过的人数比例为π。

第一次抛硬币,回答Yes人数:(1/2)πN

第二次抛硬币,回答Yes人数:(1/2)(1/2)N

所以,N*=(1/2)πN+(1/2)(1/2)N

π=2N*/N-(1/4)

专家如果使用这个方法,即使回答者的内容有些是随机的,但是专家仍然可以通过简单计算,得到正确的发生过性行为人数的比例,得到正确的统计信息。

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2018-12-27,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 斜述视角 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档