首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
技术百科首页 >数据静态脱敏 >数据静态脱敏对数据完整性有何影响?

数据静态脱敏对数据完整性有何影响?

词条归属:数据静态脱敏

数据静态脱敏对数据完整性可能产生以下几方面的影响:

一、结构完整性方面

关系型数据关联

  • 在关系型数据库中,数据通常以表的形式存在,表与表之间通过外键等关系相互关联。如果对关联表中的敏感数据进行静态脱敏,可能会影响到这种关联关系的完整性。例如,在一个包含订单表和客户表的数据库中,客户表中的客户身份证号码(敏感信息)被脱敏,而订单表通过客户ID与客户表关联。如果脱敏过程不当,可能会导致在查询订单对应的客户信息时出现关联失败或者错误关联的情况。
  • 不过,如果在脱敏过程中能够精心设计,例如采用特定的脱敏算法,使得关联键(如客户ID)不受影响,同时保证脱敏后的数据在逻辑上仍然能够正确关联,那么就可以在很大程度上维护关系型数据的结构完整性。

数据层次结构

  • 对于具有层次结构的数据,如树形结构的企业组织架构数据或者地理区域数据(国家 - 省份 - 城市 - 区县等),如果对其中的敏感部分(如企业高层管理人员信息或者特定地区的详细地理编码等)进行脱敏,可能会破坏数据的层次结构完整性。例如,若将某个地区的详细名称(包含可能涉及的敏感信息)替换为模糊的代号,可能会导致基于该地区数据的层次分析(如区域销售数据按地理层次的分析)出现偏差,因为数据的层次标识变得模糊不清。

二、语义完整性方面

业务逻辑关联

  • 数据往往承载着一定的业务逻辑。当对敏感数据进行静态脱敏时,如果处理不当,可能会破坏这种业务逻辑。例如,在一个金融贷款审批系统中,客户的收入水平是一个敏感信息。如果对收入数据进行脱敏时过度修改,使得脱敏后的收入数据与贷款额度审批业务逻辑不再匹配,就会影响数据的业务语义完整性。原本根据准确收入水平确定的贷款额度审批规则,在脱敏后的数据上可能无法正确执行,导致业务决策出现错误。
  • 然而,如果脱敏规则能够考虑到业务逻辑需求,例如在保证收入数据大致范围和相对高低关系的基础上进行脱敏(如将高收入群体、中等收入群体和低收入群体进行合理划分并脱敏表示),那么就可以在一定程度上维护数据的业务语义完整性。

数据含义准确性

  • 敏感数据的脱敏可能会导致数据含义的准确性发生变化。例如,对于一个包含个人健康状况(敏感信息)的医疗数据集,如果将具体的疾病名称进行脱敏处理,简单地用“有疾病”或“无疾病”来表示,那么在后续的医学研究或者数据分析中,这种脱敏后的数据就失去了原始疾病数据的精确含义,无法准确反映疾病的类型、严重程度等重要信息,从而影响数据完整性。但如果脱敏规则能够在保护隐私的前提下,保留部分与研究或分析相关的健康状况信息(如疾病的大致类别等),则可以减少对数据含义准确性的影响。
相关文章
《数据安全法(草案)》出台,对企业有何影响?
2020年7月2日,全国人大常委会第二十次会议审议了《数据安全法(草案)》(以下简称《数安法》)并公开征求意见。《数安法》主要围绕着数据安全管理各项基本制度、促进数据安全和发展的措施、解决数据安全领域突出总量、满足电子政务数据合理需求展开。
腾讯安全
2020-08-09
7520
数据库静态脱敏
本系统能自动运行数据扫描任务,先从数据源中获取少量的样本数据,再与系统内置的敏感数据指纹特征进行比对,快速识别敏感数据类型,并记录敏感数据的存放位置。
数据库保护
2019-07-19
2.9K0
学界 | 数据并行化对神经网络训练有何影响?谷歌大脑进行了实证研究
神经网络在解决大量预测任务时非常高效。在较大数据集上训练的大型模型是神经网络近期成功的原因之一,我们期望在更多数据上训练的模型可以持续取得预测性能改进。尽管当下的 GPU 和自定义神经网络加速器可以使我们以前所未有的速度训练当前最优模型,但训练时间仍然限制着这些模型的预测性能及应用范围。很多重要问题的最佳模型在训练结束时仍然在提升性能,这是因为研究者无法一次训练很多天或好几周。在极端案例中,训练必须在完成一次数据遍历之前终止。减少训练时间的一种方式是提高数据处理速度。这可以极大地促进模型质量的提升,因为它使得训练过程能够处理更多数据,同时还能降低实验迭代时间,使研究者能够更快速地尝试新想法和新配置条件。更快的训练还使得神经网络能够部署到需要频繁更新模型的应用中,比如训练数据定期增删的情况就需要生成新模型。
机器之心
2018-12-28
5290
基于物联网的移动应用对增强用户体验有何影响
What-Impact-Do-IoT-Based-Mobile-Apps-Have-In-Enhancing-User-Experience-1068x656-1.jpg
用户4122690
2020-06-14
7660
源码翻译|MongoDB有哪些数据脱敏技术?
为什么需要知道掩盖技术?因为这是一种匿名化数据的方法,这样就可以使用包含敏感或个人信息的数据进行测试或开发。 即使你负责的数据库具有完全的访问控制和安全性,你也可能需要多种数据脱敏技术来支持应用程序。 例如,你可能需要动态脱敏数据以确保应用程序不会暴露不必要的敏感信息。或者,如果您需要对实际生产数据运行测试或开发,而实际生产数据包含个人或敏感信息,则可能需要脱敏真实数据。 如果你需要将生产数据推到一个安全性较低的环境,你也需要进行数据脱敏技术,为了分发报告或者分析相应的数据,并且必须保留报告所需要的基础数据
MongoDB中文社区
2022-03-16
1.5K0
点击加载更多
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
领券