首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

大数据脱敏

K-Anonymity定义如下: K-Anonymity要求对于任意一行纪录,其所属的相等集内纪录数量不小于k,即至少有k-1条纪录半标识列属性值与该条纪录相同。...图二中的数据是一个3-Anonymity的数据集。...作为一个衡量隐私数据泄露风险的指标,K-Anonymity可用于衡量个人标识泄露的风险,理论上来说,对于K-Anonymity数据集,对于任意纪录,攻击者只有1/k的概率将该纪录与具体用户关联。...表3 3-Anonymity 2-Diversity 病人信息 相对于K-Anonymity标准,符合L-Deversity标准的数据集显著降低了属性数据泄露的风险。...表5 常用数据变形操作 此外,K-Anonymity, L-Diversity和T-Closeness约束可能还需要生成干扰数据,敏感数据干扰项的生成策略与方法也是保证K-Anonymity, L-Diversity

2.3K40
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    大数据平台数据脱敏介绍

    K-Anonymity定义如下: K-Anonymity要求对于任意一行纪录,其所属的相等集内纪录数量不小于k,即至少有k-1条纪录半标识列属性值与该条纪录相同。...图二中的数据是一个3-Anonymity的数据集。...作为一个衡量隐私数据泄露风险的指标,K-Anonymity可用于衡量个人标识泄露的风险,理论上来说,对于K-Anonymity数据集,对于任意纪录,攻击者只有1/k的概率将该纪录与具体用户关联。...L-Diversity K-Anonymity可用于保护个人标识泄露的风险,但是无法保护属性泄露的风险。...基于图二的数据通过插入干扰纪录,一个3-Anonymity 2-Diversity的数据集如表三所示: 相对于K-Anonymity标准,符合L-Deversity标准的数据集显著降低了属性数据泄露的风险

    2.2K40

    数据淘金热时代下的隐私问题何去何从——探讨国内外法规下的匿名化概念

    匿名化作为一种解决“数据可用”和“隐私保护”两难困境的有效技术,在学术界首先引入深入广泛的研究,包括各类不同算法、模型以及基础理论的研究,如著名的K-匿名算法 (K-anonymity)。...该意见书对假名化(Pseudonymisation)、加噪(Noise addition)、K-匿名化(K-anonymity)等多种技术进行分析,结论是这些方法处理后的数据均不符合这三个标准,多少都存在一定程度的剩余风险...除了匿名化 (Anonymization) 和去标识化(De-identification) 概念外,我们可以看到其他两个较为相近的概念,假名化 (Pseudonymization) 和K -匿名(K-anonymity...K -匿名(K-anonymity):K-匿名模型要求发布的数据中,指定标识符(直接标识符或准标识符)属性值相同的每一等价类至少包含K个记录,使攻击者不能判别出个人信息所属的具体个体,从而保护了个人信息安全...而K -匿名(K-anonymity)的模型通过K个记录相同,使得攻击者无法识别该记录的“个人信息主体”,可看作实现匿名化的一种理想的手段。K -匿名一定属于匿名化技术吗?

    1.1K20
    领券