数据安全平台支持的数据分类分级方法是以国家标准为核心框架,结合行业特性与技术创新,融合自动化工具与人工干预的综合体系,旨在实现数据分类的科学性、分级的精准性及保护的适配性。以下从核心框架、分类方法、分级方法、技术实现、行业实践五大维度展开详细说明:
一、核心框架:国家标准GB/T 43697-2024的通用规则
2024年10月1日起实施的《数据安全技术 数据分类分级规则》(GB/T 43697-2024)是国家层面数据分类分级的通用准则,为数据处理者(包括企业、政府、社会组织等)提供了可遵循的底层逻辑。其核心框架包括:
- 分类维度:按行业领域(如工业、金融、医疗、教育等)、业务属性(如数据主体、内容主题、数据用途、数据来源等)划分,例如金融行业可分为“客户个人信息”“交易数据”“风控数据”等类别。
- 分级框架:将数据分为核心数据、重要数据、一般数据三个级别,其中:
- 核心数据:对领域、群体、区域具有较高覆盖度或达到较高精度、较大规模、一定深度的,一旦被非法使用或共享,可能直接影响政治安全的重要数据(如关系国家安全重点领域的数据、国民经济命脉数据)。
- 重要数据:特定领域、特定群体、特定区域或达到一定精度和规模的,一旦被泄露或篡改、损毁,可能直接危害国家安全、经济运行、社会稳定、公共健康和安全的数据(如支撑关键信息基础设施的行业核心业务数据)。
- 一般数据:核心数据、重要数据之外的其他数据(如企业内部非敏感的管理数据)。
二、分类方法:多维度、可扩展的体系
数据安全平台支持多维度分类,以适应不同行业、不同业务场景的需求,常见分类方法包括:
- 按行业领域分类: 根据数据处理活动涉及的行业划分,如工业企业可分为“研发数据”“生产运行数据”“管理数据”;金融企业可分为“客户数据”“业务数据”“经营管理数据”;政府机构可分为“政务数据”“公共服务数据”“社会治理数据”。
- 按业务属性分类: 从业务出发细分,如:
- 数据主体:公共数据(政府采集)、组织数据(企业内部)、个人信息(自然人);
- 共享属性:无条件共享(如公开的政策文件)、有条件共享(如需审批的客户统计数据)、不予共享(如企业商业秘密);
- 应用场景:经济调节数据(如GDP统计)、市场监管数据(如企业信用信息)、公共服务数据(如社保缴纳记录)。
3. 按敏感程度预分类: 结合数据的敏感性初步划分,如“公开数据”“内部数据”“秘密数据”“机密数据”,为后续分级提供基础。
三、分级方法:基于风险与影响的精准划分
数据安全平台的分级方法以“影响程度”为核心,结合数据的敏感程度与潜在风险,常见分级方法包括:
- 按敏感程度分级(参考):
- 1级(公开数据):可免费获取,无限制或不利后果(如营销材料、联系信息);
- 2级(内部数据):不打算公开,安全要求较低(如客户数据、销售手册);
- 3级(秘密数据):敏感数据,泄露可能损害公司或合作伙伴(如供应商信息、员工薪水);
- 4级(机密数据):高度敏感,泄露可能导致财务、法律风险(如客户身份信息、信用卡信息)。
2. 按影响程度分级(参考):
- 1级(无影响):数据破坏对企业或个人无影响;
- 2级(轻微影响):影响范围小,损失可控(如局部业务流程中断);
- 3级(重要影响):造成重要商业、经济或名誉损失(如核心客户数据泄露);
- 4级(严重影响):危害国家安全或社会稳定(如国家自然资源数据泄露)。
3. 国标导向的分级: 结合GB/T 43697-2024的要求,通过重要数据识别指南(如17项考虑因素,包括“直接影响领土安全”“反映国家自然资源基础”“支撑关键信息基础设施运行”等)确定重要数据,再根据影响程度划分为核心、重要、一般数据。
四、技术实现:自动化与人工干预结合
数据安全平台通过技术创新提升分类分级的效率与准确性,主要技术方法包括:
- 规则引擎: 基于预设规则(如正则表达式、关键词匹配)自动识别敏感数据,例如通过“身份证号”“银行卡号”等关键词识别个人信息,或通过“交易金额”“客户名称”等规则识别金融敏感数据。平台支持自定义规则,适配企业特定需求。
- 机器学习/AI算法: 通过训练模型(如分类算法、聚类算法)自动识别数据类别与级别,例如通过自然语言处理(NLP)识别非结构化数据(如文档、邮件)中的敏感信息,或通过深度学习识别图像、音频中的敏感内容。机器学习可提升复杂场景下的分类分级准确性,减少人工干预。
- 人工+智能混合模式: 结合人工与技术优势,例如:
- 人工干预为分类分级提供上下文(如行业法规、企业政策),确保符合合规要求;
- 技术工具实现效率与一致性(如全天候分类、避免人工误差)。