首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >为什么加性噪声在微分隐私中需要用灵敏度来校准?

为什么加性噪声在微分隐私中需要用灵敏度来校准?
EN

Stack Overflow用户
提问于 2020-06-23 22:28:01
回答 2查看 155关注 0票数 1

作为差别化隐私的初学者,我想知道为什么噪音机制的差异需要用灵敏度来校准?这样做的目的何在?如果我们不校准它并添加一个随机方差,会发生什么?

在拉普拉斯噪声中的例子场景这里,为什么刻度参数被校准?

EN

回答 2

Stack Overflow用户

回答已采纳

发布于 2020-06-27 20:13:53

可以直观地理解这一点的一种方法是,想象一个函数返回两个值中的任何一个,例如0和a作为实的a。

进一步假设我们有一个加性噪声机制,这样我们在真实的线上得到两个概率分布,就像您所附链接中的图像一样(这是上面使用a=1的设置的一个例子):

在纯DP中,我们感兴趣的是计算这些分布在整个实际线上的比率的最大值。正如链接中的计算所示,这个比率在任何地方都被e和epsilon的幂所限制。

现在,设想将这些分布的中心进一步分开,比如将红色分布移到右边(IE,增加a)。很明显,这将减少红色分布在0上的概率质量,这是这个比率的最大值。因此,这些分布在0处的比率会增加--一个常数(蓝色分布位置在0上的质量)除以一个较小的数。

我们可以将比例降下来的一种方法是“肥肥”出分布。这将对应于将分布的峰值移到更低的位置,并将质量分散到更宽的区域(因为它们必须整合到1,这两件事必然耦合到像Laplace这样的分布中)。在数学上,我们将通过增加Laplace分布的方差(在参数化这里中增加b)来实现这一点,它的作用是降低蓝色分布在0的峰值,并在0处提高红色分布位置的质量,从而降低它们之间的比值(较小的分子和较大的分母)。

如果执行计算,您将发现方差参数b与函数f的灵敏度之间的关系实际上是线性的,也就是说,将b设为

将此比率的最大值修正为

这正是纯差别隐私的定义。

票数 1
EN

Stack Overflow用户

发布于 2020-06-24 06:53:32

如果你添加任意数量的随机噪声,你就会得到随机数据。当然,它保留了隐私,但同时也破坏了数据中的任何真实价值。您添加的噪声需要与现有分布相匹配,以便在不破坏数据值的情况下保护隐私。校准步骤就是这么做的。

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/62544709

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档