内置敏感词库可帮助您快速定义常用敏感数据。您可以自定义敏感词,支持关键字、正则表达式、字典等多种匹配方式,添加的自定义敏感词将应用于文件识别,为不同类型的数据信息提供精准匹配方案:
结构化数据(如身份证号):建议采用正则表达式精确匹配。
非结构化数据(如客户隐私文本):建议使用关键字匹配。
复杂文本内容:建议通过字典匹配结合权重计算,判定是否为敏感文件。
1. 登录 iOA 零信任管理平台控制台,在左侧导航栏,选择数据安全中心 > 分级分类运营 > 敏感词库。
2. 在敏感词库页面,单击添加词库。

3. 在添加词组页面,选择所需词组类型,并配置相关参数。
关键字:使用关键字来标识敏感内容。如果文件中的某部分内容与关键字匹配,就会触发规则,将其判定为敏感文件。

正则:使用正则表达式来标识敏感元素的内容。如果文件中的某部分内容与正则表达式匹配,并且匹配次数达到或超过您设定的次数,那么就会触发规则,文件将被判定为敏感文件。

字典:当文档中的检测到的关键字加权分值超过设定的阈值,该文档便被判定为敏感文件。在此检测过程中,字典内的关键字不会被重复计算(即使多次出现也只计算一次)。每当文档中出现一个关键字,权重值就会增加相应的分值。总权重值的设定范围最低为1,最高不超过所有关键字权重值的总和。
示例:如下图所示:4个关键字,总权重分是400分,每个关键字命中加100分,总权重分数达到或超过299,就会判定为敏感文件。这意味着只要命中了3个关键字,就会触发规则。

4. 敏感词库配置完成,单击保存,配置的敏感词库,用于分级分类运营 > 分级分类规则 >敏感内容中,用于识别、定位和处理敏感数据。通过预设的关键字、模式或规则,帮助系统快速发现如个人身份信息、财务信息等敏感内容。
