专栏首页数据库安全《数据安全能力成熟度模型》实践指南:数据分级分类
原创

《数据安全能力成熟度模型》实践指南:数据分级分类

2019年8月30日,《信息安全技术 数据安全能力成熟度模型》(GB/T 37988-2019)简称DSMM(Data Security Maturity Model)正式成为国标对外发布,并已于2020年3月起正式实施。

DSMM将数据按照其生命周期分阶段采用不同的能力评估等级,分为数据采集安全、数据传输安全、数据存储安全、数据处理安全、数据交换安全、数据销毁安全六个阶段。DSMM从组织建设、制度流程、技术工具、人员能力四个安全能力维度的建设进行综合考量。DSMM将数据安全成熟度划分成了1-5个等级,依次为非正式执行级、计划跟踪级、充分定义级、量化控制级、持续优化级,形成一个三维立体模型,全方面对数据安全进行能力建设。

图1:数据分级分类三维立体模型

在此基础上,DSMM将上述6个生命周期进一步细分,划分出30个过程域。这30个过程域分别分布在数据生命周期的6个阶段,部分过程域贯穿于整个数据生命周期。

图2:数据生命周期安全过程域

随着《中华人民共和国数据安全法(草案)》的公布,后续DSMM很可能会成为该法案的具体落地标准和衡量指标,对于中国企业而言,以DSMM为数据安全治理思路方案选型,可以更好的实现数据安全治理的制度合规。

本系列文将以DSMM数据安全治理思路为依托,针对上述各过程域,基于充分定义级视角(3级),提供数据安全建设实践建议,本文作为开篇,将介绍数据采集安全阶段的数据分类分级过程域(PA01)。

01定义

DSMM标准在充分定义级对数据分类分级要求如下:

组织建设

组织应设立负责数据安全分类分级工作的管理岗位利人员,主要负责定义组织整体的数据分类分级的安全原则(BP.01.04)。

制度流程

1)应明确数据分类分级原则、方法和操作指南(BP.01.05);

2)应对组织的数据进行分类分级标识和管理(BP.01.06);

3)应对不同类别利级别的数据建立相应的访问控制、数据加解密、数据脱敏等安全管理和控制措施(BP.01.07);

4)应明确数据分类分级变更审批流程和机制,通过该流程保证对数据分类分级的变更操作及其结果符合组织的要求(BP.01.08)。

技术工具

应建立数据分类分级打标或数据资产管理工具,实现对数据的分类分级自动标识、标识结果发布、审核等功能(BP.01.09)。

人员能力

负责该项工作的人员应了解数据分类分级的合规要求,能够识别哪些数据属于敏感数据(BP.01.10)。

02实践指南

组织建设

组织机构在条件允许的情况下应该设立一个数据分类分级部门并招募相关人员,负责公司整体的数据分类分级工作,包括负责定义组织机构整体的数据分类分级安全原则和操作指南、推动相关指南的落地情况、建立数据分类分级审批机制、对组织机构中的进行完数据分类分级的数据进行标识和管理、对识别到的敏感数据进行脱敏处理、对数据分类分级中的重要操作进行审计和记录等。

人员能力

针对数据分类分级岗位的相关人员,需要具备良好的数据安全风险意识,熟悉国家网络安全法律法规以及组织机构所属行业的政策和监管要求,在采集数据的过程中严格按照《网络安全法》、《个人信息安全规范》等相关国家法律法规和行业规范执行,除此之外,还需要相关人员具备良好的数据分类分级基础,了解公司内部的数据资产范围、组织架构,能够准确识别出哪些数据属于敏感数据等,同时还需要相关人员熟悉数据分类分级的合规要求,熟练掌握数据安全措施,拥有制定标准化流程或制度的经验,能够根据公司的具体情况制定出符合公司真实环境的数据分类分级原则、数据分类分级操作指南、数据分类分级管理制度、数据分类分级清单等,并推动相关要求与制度的真实落地。

落地执行性确认

针对组织建设和对应人员能力的实际落地执行性确认,可通过内部审计、外部审计等形式以调研访谈、问卷调查、流程观察、文件调阅、技术检测等多种方式实现。

制度流程

1)数据分级分类原则

数据分级分类应结合实际情况,明确需求,以数据的属性为基础,遵循科学性、稳定性、实用性和扩展性原则。

❖ 科学性——按照数据的多维特征以及相互间客观存在的逻辑关联进行科学和系统化的分级分类;

❖ 稳定性——根据实际情况,以数据最稳定的特征和属性为依据指定分级分类方案;

❖ 实用性——数据的分级分类要确保每个类目下要有数据,不设没有意义的类目;

❖ 扩展性——数据分级分类方案在总体上应具有概括性和包容性,能够实现各种类型数据的分类,以及满足将来可能出现的数据类型。

2)分级分类方法及细则

❖ 数据分类常用方法:按关系分类,基于业务(来源)、基于内容、基于监管等。

❖ 数据分级常用方法:按特性分级,基于价值(公开、内部、重要核心等)、基于敏感程度(公开、秘密、机密、绝密等)、基于司法影响范围(大陆境内、跨区、跨境等)。

❖ 常见公用数据分类方法:重要数据、个人及企业信息、业务数据。(重要数据指泄露可导致危害国家安全/公共利益生命财产安全/危害国家关键基础设施/扰乱市场秩序/可推论出国家秘密等的数据。)

❖ 个人及企业信息包含直接个人信息:以电子或者其他方式记录的能够单独或者与其他信息结合识别自然人个人身份或企业的各种信息。

❖ 业务数据包含:企业或公共组织从事经营活动或例行社会管理功能、事务处理等一系列活动产生的可存储的数据。

根据上述公共分类,其对应分级分别如下:

图3:重要数据分级
图4:个人及企业信息分级
图5:业务数据分级

企业可基于上述公共分类、分级策略,结合自身业务、合规需求实际,规划出自己的数据分类分级方法,建立组织/公司自己的的数据分类分级原则和方法,将数据按照重要程度进行分类,然后在数据分类的基础上根据数据安全在受到破坏后,对组织造成的影响和损失进行分级。

图6:企业自主分类分级示例

在进行数据分类分级后需要有针对性地制定数据防护要求,设置不同的访问权限、对重要数据进行加密存储和传输、敏感数据进行脱敏处理、重要操作进行审计记录和分析等。

3)变更审核

在进行分类分级工作中要明确相关内容和操作流程的审核和审批机制,保证数据分类分级工作符合组织的分类分级原则和制度要求。原则上已被明确分类分级的数据,其分级只可升级不可降级(防止泄密),审批需多人控制,涉及数据所有者、数据分类分级管理者,行者管理者等。

4)技术工具简述

数据分类分级技术工具实现落地的前提是确定了组织内部的数据分类分级方法和策略,也就是分类和分级的规则。技术层面看,数据分类分级首先涉及到最初的数据发现,目前数据类型可以分为两种,一种是结构化的数据,如业务数据、数据库等;另外一种则是非结构化的数据,如商业文件、财务报表、合同等,依据标签库、关键词、正则表达式、自然语言处理、数据挖掘、机器学习等内容识别技术,进行数据分类,根据数据分类的结果,依据标签进行敏感数据的划分,最终实现数据分级的效果。

按元数据类型分类技术:

内容感知分类技术,对非结构化数据内容的自动分析来确定分类,涉及正则表达式、完全匹配、部分或完整指纹识别、机器学习等。

情境感知分类技术,基于数据特定属性类型,利用广泛上下文属性,适用于静态数据(如基于存储路径或其他文件元数据)、使用中的数据(如由CAD应用程序创建的数据)和传输中的数据(基于IP)。

按实际应用场景分类技术:

根据分类分级规则,建立标签库,利用机器学习算法经过训练形成分类器,利用分类器将生成的分类器应用在有待分类的文档集合中,获取文档的分类结果,并可进行自动化打标。

受限于篇幅,此处技术工具不进行进一步展开,下图为数据分级分类的技术工具进行分类分级作业的基本流程图。

图7:分类分级作业的基本流程图

本文转自杭州美创科技有限公司(第59号),如需二次转载,请咨询。

原创声明,本文系作者授权云+社区发表,未经许可,不得转载。

如有侵权,请联系 yunjia_community@tencent.com 删除。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 助力浙江 “数据高铁”建设,实现秒级共享

    从“最多跑一次”到“一次不用跑”,随着智慧政务建设的不断深入,政务服务能力和现代化治理水平不断提升。而这背后,实现跨部门事项联办、数据信息互通,加快推进部门间信...

    数据安全
  • 数据库防火墙:数据库防火墙商业化的前提条件

    数据库防火墙和一般的传统数据库安全设备不同,它部署在应用服务器和数据库服务器之间。业务系统巨大的流量将穿越数据库防火墙,数据库防火墙任何的风吹草动都会影响业务系...

    数据安全
  • 《数据安全能力成熟度模型》实践指南:数据采集管理

    2019年8月30日,《信息安全技术 数据安全能力成熟度模型》(GB/T 37988-2019)简称DSMM(Data Security Maturity Mo...

    数据安全
  • 注册不到两年半Github标星39k+,吴恩达、李航老师的作品的笔记和代码实现

    吴恩达老师的机器学习课程个人笔记、翻译的字幕(含视频)、复现的 python 代码等,同时笔记的 word 和 markdown 文件也开源了。

    黄博的机器学习圈子
  • ArcPY系列之三(字段计算)

    自从上次发了一篇包含大量动图的推送后,很多朋友都后台发消息给我说,相比较文字,动图更加直观。我就想:既如此,何不录个视频来进行演示?于是就有了这篇推送中的视频内...

    数据处理与分析
  • BigBiGAN问世,“GAN父”都说酷的无监督表示学习模型有多优秀?

    众所周知,对抗训练生成模型(GAN)在图像生成领域获得了不凡的效果。尽管基于GAN的无监督学习方法取得了初步成果,但很快被自监督学习方法所取代。

    AI科技大本营
  • 2017年度盘点:15个最流行的GitHub机器学习项目

    在本文中,作者列出了 2017 年 GitHub 平台上最为热门的知识库,囊括了数据科学、机器学习、深度学习中的各种项目,希望能对大家学习、使用有所帮助。另,小...

    企鹅号小编
  • 2017年度盘点:15个最流行的GitHub机器学习项目

    作者:Sunil Ray 在本文中,作者列出了 2017 年 GitHub 平台上最为热门的知识库,囊括了数据科学、机器学习、深度学习中的各种项目,希望能对大家...

    企鹅号小编
  • Github标星超7k!从零开始,最简明扼要的数据科学学习路径(附高效免费小工具)

    试图入门一个新话题时,多数人会感到不知所措?这时候,一份明确的学习路径可以帮你去除这一焦虑。

    磐创AI
  • 15 个有趣的 JS 和 CSS 库

    作者:Danny Markov,译者:IT程序狮 译文:https://zhuanlan.zhihu.com/p/31321429 原文:https://tut...

    程序员宝库

扫码关注云+社区

领取腾讯云代金券