本次更新继续分享企业数据治理的相关学习心得,知识点源自《DAMA数据管理知识体系指南》第10章,核心关于企业文档和内容管理。
简介
文档和内容管理是对存储在关系数据库以外的信息的采集、存储、访问以及使用的控制活动,侧重完整性和访问控制,因此它与关系数据库的数据操作管理大致相同
文档和内容管理战略重点与其他数据管理职能相互有些重叠,主要用于满足非结构化数据的治理、架构、安全、受控的元数据和数据质量的需要
文档管理是对电子和纸质文件的存储、详细编目和控制,包含控制和组织文档与档案的过程、技巧和技术,它对电子或纸质文档都适用
内容管理是对信息内容进行组织、分类和结构化的访问所涉及的过程、技巧和技术,实现对文档进行有效的检索和重用。企业内容管理(ECM),意味着内容管理的范围涉及整个企业
文档管理并不关注文件中的具体内容,一个文件的信息内容通常可以帮助管理该文件,但文档管理将其视为一个单独的个体。内容管理则关注每个文件的内在内容并试图识别和使用这些包含在文件中的信息
概念和活动
随着业务流程和角色相互交织,以及厂商试图扩大其技术产品的市场,文档管理和内容管理的界限正在变得越来越模糊
非结构化数据是很有价值的企业资产之一。有效存储、完整性、安全、内容质量、访问和使用对管理非结构化数据起着指导作用。非结构化数据对治理、架构、安全、元数据和数据质量也有要求
文档管理系统用于追踪和存储电子文件和纸质文件的扫描图像,其中文档库系统、电子邮件系统和图像管理系统是文档管理系统的特殊形式,一般提供存储、版本管理、安全、元数据管理、内容索引和检索功能
内容管理系统用于收集、组织、索引和检索信息内容,并将其内容存储于部分或完整文档,与此同时维持这些部分间的联系
文档管理系统可以提供内容管理功能,但内容管理系统不关心这些文件存储在哪里以及如何存储
“
非结构化数据
”
据统计,企业中有高达80%的数据存储在关系数据库之外
非结构化数据存在于不同的电子格式当中,包括WORD文档,电子邮件、电子表格、XML文件、事务性消息、报告、商业图表、数字图像、缩微胶片、录像和录音,大量的非结构数据同样存在于纸质文档中
“
文档/档案管理
”
文档/档案管理是企业重要文件的生命周期管理,不是所有的文档都如该组织的业务活动和遵守法规证据那样重要
档案管理是对纸质和缩微胶片、影片档案的管理,包括从它们的创建、加工、分发、组织和恢复到它们最终被转储的过程。档案可以以物理形式存在,也可以是电子格式,如电子邮件内容、网站上的内容、媒体和硬件的所有类型文件以及包含在各种数据库里的数据
文档/档案管理的生命周期包括以下活动:
识别已有和新建文档/档案
文档/档案政策的创建、批准和实施
文档/档案的分类
文档/档案保留政策
纸质和电子文档/档案的短期和长期存储
检索和流转,即按照政策、安全、控制标准和法律要求允许访问和流通文档/档案
保存和处理,根据企业需要、状态和规定来存档和销毁文档/档案
文档管理活动涉及在文档生命周期的不同阶段的计划,从其创建或接收、检索、流转和存档到转储。制定索引系统与分类法使检索文档更加容易
规划文档/档案管理步骤:
首先确定文档/档案的责任单位,并由该单位制定短期和长期的档案存储计划
根据公司标准和政府规章创建和管理档案保留政策
协调内外部档案的访问和分发,并整合最佳实践和企业其他部门的流程,同时还为关键文档/档案创建业务连续性计划
实施存档的保留计划和条例
文档可以在文档管理系统内容创建,也可以通过扫描器或OCR软件来获取。这些电子文档必须在获取过程中由关键词或文字形式索引,以便于查找
元数据,例如文档的创建、修改、存储日期,创建者姓名都要存储起来
文档可以使用一个唯一的文档标识符或通过制定的部分搜索字词进行检索,这些搜索词涉及文档分类标识和预期元数据等
许多文档管理系统都包括电子资产管理,如音频、视频、音乐和数码照片的数字资产管理,其任务是对数字资产的分类、存储和检索
文档管理系统有权限管理模块,管理者可以根据文档类型和用户角色来管理访问权限,安全限制包括隐私和密级限制,可在文档创建、管理和传送过程中实施。电子签名保证了文档传送者的身份、信息的真实性等
文档/档案管理系统需要成为整个公司所有数据与信息备份和恢复的一部分,文档/档案管理者应参与风险降低和管理,以及业务连续性活动(小编理解为高可用或灾难恢复),尤其是关于关键档案的安全性问题
文档/档案保留和处置程序(档案专业中应对应理解为鉴定与销毁)定义了一个时间段,在其间必须维护文档/档案的操作或历史数值,此外该程序明确合规流程、方法和文档/档案的处置计划。非增值信息应从组织的存档中移除以防止浪费物理和电子空间
文档/档案管理要求定期审计来确保正确的信息在正确的时间送达正确的人员以做决策或进行运营活动
“
内容管理
”
内容管理是对数据和资源的组织、分类和构造,以便在不同地方存储、发布和重用他
内容包括数据和信息在生命周期各个阶段中不同形式的成品,内容可存在于电子、纸质或其他媒介上
在内容的完整形式上,很多内容对于一个企业来说很可能成为档案问题,并在档案生命周期的不同阶段要求不同的保护措施
信息内容架构
对于一个文档或内容管理系统,内容架构识别文档和内容之间的联系和关系,说明文件的要求和属性,定义文档的内容结构或内容管理系统
当创建信息内容架构时会用到信息分类元数据,分类法是一种分类的科学和技术,它从世界的本体论角度发展起来。而本体是一种模型,代表一套概念和它们在某个领域内概念见得关联,通常由多个类和定义组成的一个分类层级
元数据索引
非结构化数据内容的元数据开发有多种形式,主要基于以下几点:
非结构化数据的格式,通常数据格式决定了访问数据的方法
相关非结构化数据中是否有可用的搜索工具
元数据是否可以自生成
现有方法和方案是否可被采纳或适用
需要细致彻底的检索功能
内容访问与检索
一旦内容按照元数据/关键词标记并且按照适当的信息内容架构分类,它将可以用于检索和使用。例如搜索引擎是对用户请求的信息进行检索,从网页内容中包含关键词的网站获取信息的软件
专家使用多个组织内的搜索工具获取信息,这些非结构化的数据可用于听证、专用检索、行政查询等立法或监管报告的需要
一些内容理解程序可以帮助用户找到那些想看的页面,这些程序依赖于自然语言、机读信息、模糊搜索方法、资源描述格式(RDF)元数据、本体和XML技术
XML促进了数据在不同信息系统和互联网中的共享。为识别数据含义,XML会对数据元素进行标记。此外XML命名空间提供了一种方法来避免两个不同文档在使用相同元素名称上的冲突
XML是能够表达结构化和非结构化数据信息的语言,元数据应用XML技术可以描述任何文档或者数据库的内容、结构和业务规则
计算机程序无法直接处理非结构化数据内容,但XML可以识别和标注非结构化数据内容,是计算机程序能够识别和处理这些内容,这样结构化的数据就可以附加在非结构化内容上
小编说
对于元数据与XML小编曾经在之前的更新中有过提及,在此附上链接,方便小伙伴查看。
聊一聊数字档案管理中的元数据
内容质量治理
非结构化数据的管理需要数据管理专员、数据管理专业人员以及档案经理相互协作,需要考虑与结构化数据治理相类似的动态因素。业务数据管理专员可以帮助确定门户网站、企业分类、搜索引擎索引及内容管理等问题
在一个企业中数据治理的重点包括文档和档案的保留政策、电子签名政策、报告形式以及报告分配政策。数据管理专业人员是实施和执行这些政策以实现对非结构化形式数据资产的保护和平衡。在组织机构中满足业务需求的关键是强化档案管理专业人员能力
高质量、准确以及实施更新的信息对于商务决策至关重要。及时决策能够增加竞争优势和企业效益
▼
领取专属 10元无门槛券
私享最新 技术干货