企业开展PII(个人可识别信息)数据保护的盘点与分类,需结合技术工具、业务流程与合规要求,构建覆盖全生命周期的动态管理体系。以下是基于行业实践与标准(如GDPR、DCMM)的系统化方法:
一、明确目标与组织保障
- 战略对齐
- 业务目标:明确数据保护的核心目的(如合规、降低泄露风险、支持数据共享)。
- 合规要求:梳理适用法规(如《个人信息保护法》、GDPR、CCPA),提取关键义务(如数据最小化、跨境传输限制)。
2. 组织架构设计
- 跨部门协作:成立由法务、IT、业务部门组成的联合工作组,明确数据Owner职责。
- 治理委员会:高层领导(如CDO)负责决策,数据治理团队执行具体任务。
二、数据资产盘点与发现
- 范围界定
- 业务范围:覆盖核心业务系统(如CRM、ERP)、第三方服务(如广告平台)、云存储(如腾讯云COS)。
- 数据类型:结构化数据(数据库表)、非结构化数据(邮件、日志)、半结构化数据(JSON/XML)。
2. 技术工具应用
- 自动化扫描:使用元数据管理工具(如Apache Atlas、Alation)扫描数据源,生成资产清单。
- 敏感数据识别:通过正则表达式、AI模型识别PII字段(如身份证号、手机号)。
3. 元数据采集
- 提取数据的技术属性(存储位置、更新频率)、业务属性(所属业务域)、安全属性(敏感度标签)。 输出物:《数据资产目录》《元数据清单》。
三、PII分类与分级
- 分类维度
- 业务属性:客户数据(PII)、员工数据、交易数据、设备数据。
- 技术属性:数据库字段、文件类型(PDF/Excel)、API接口。
- 来源属性:内部生成(如用户注册)、外部获取(如供应商数据)。
2. 分级标准
- 4级模型(参考GB/T 35000-2023): 级别定义示例4级(核心敏感)泄露导致灾难性影响生物识别数据、未公开财务数据3级(重要)泄露造成重大损害客户身份证号、银行账户2级(一般)泄露带来局部影响内部员工邮箱、会议纪要1级(公开)可对外披露企业官网新闻、产品说明书 注:金融行业可能细化至5级,医疗行业需考虑HIPAA合规要求。
3. 分级方法
- 规则驱动:基于预定义规则(如正则表达式)自动打标。
- 人工审核:对非结构化数据(如合同文档)进行人工校验。
四、制定分类分级策略
- 差异化管控
- 4级数据:加密存储(AES-256)、禁止跨境传输、操作需双重审批。
- 3级数据:动态脱敏(如查询时隐藏部分手机号)、访问日志审计。
- 2级数据:基于角色的访问控制(RBAC)、定期备份。
- 1级数据:无特殊限制,但需防止滥用。
2. 技术实现
- 数据脱敏:对测试/开发环境中的PII进行替换(如将“张三”替换为“用户A”)。
- 权限管理:通过ABAC(属性访问控制)限制访问(如仅财务部门可查看工资数据)。
五、动态维护与持续优化
- 定期更新机制
- 季度审查:根据业务变化(如新系统上线)调整分类分级。
- 事件驱动更新:数据泄露后重新评估敏感度(如某字段被证实可关联到个人)。
2. 技术监控
- 实时扫描:通过DLP工具监控数据流动,拦截异常传输(如大量PII外发)。
- 血缘分析:追踪数据流转路径,识别高风险操作(如将PII导入未授权的云存储)。
3. 合规审计
- 自动化报告:生成《PII保护合规报告》,供监管机构审查。
- 第三方评估:通过ISO 27701认证,验证分类分级体系的有效性。