档案数据库“肚子里”有什么东西

档案数据库是以一定的组织方式存储在一起的机读档案数据的集合。“记录”是档案数据库的基本单元,是对某一份文件或案卷的题名、责任者、时间、页码、分类号、主题词、摘要等进行描述的结果,每条记录相当于一条著录条目。一个档案数据库由若干条记录组成,这些记录被组织起来以供检索和显示之用。

档案数据库的特点

集中性。档案数据库对档案数据实行集中化控制,可将各种有关数据集中在一起进行统一的控制和管理,保证了数据的一致性、完整性。

结构化。档案数据具有复杂的数据结构,它将各应用系统的全部数据合理地组织起来。

低冗余度。数据库中的档案数据重复少,数据的冗余度被控制在最低限度,节省了计算机存储空间。

可靠性。数据库系统采取各种手段加强了对数据的保护,保证了数据的安全可靠。

共享性。数据库系统内的各应用程序可以共用,数据库还可以出售,供不同用户、不同系统使用。

常见档案数据库形式

目录数据库,是数字档案资源管理的基础,它是将反映数字档案特征的规范数据,依照一定的字段要求存入计算机中,通过系统的排序等处理,形成由计算机检索的目录数据体系。

数字档案元,数据是保证数字档案可靠和可用的一项重要措施。元数据库建设按照数字档案元数据采集规范要求建立。元数据采集方式主要是通过对电子文件或数字档案的北京、结构和管理过程信息进行自动生成和适当人工添加而形成。

内容数据库,是数字档案资源建设的主体,它是通过数据库、数据仓库等技术方法将档案全文按照一定的分类、排序方式排列形成的集合。内容数据一般通过与目录数据挂接方式实施有效管理,随着信息技术特别是检索技术的发展,将来也会采用其他技术方法对内容数据进行有效管理。对于由电子文件归档形成的电子档案,其内容数据还应与其元数据建立持久有效的联系,防止非法修改,采取技术措施,确保其可靠和可用。

档案数据库的性能指标

数据收录的完整性。数据库覆盖面的大小、收录数据的完备程度,关系到它是否能全面满足用户的检索要求,是取信于用户的基本前提。

数据收录的准性。保证档案检索系统检索效率的重要因素,数据的任何差错,如格式的不一致、字符的出入、拼写的失误,对计算机处理数据和检索结果都有很大影响。尤其在数值型和事实型数据库中,数据的不准确将会造成严重后果,可能导致用户对数据库的彻底否定。

信息含量的充分性。它指档案数据库揭示档案信息特征的充分程度,如对一份档案著录项目的详细程度;有无摘要;摘要的详略如何;标引深度的大小等。数据库的信息含量越充分,就越有助于用户判断档案的价值及其切题程度,从而帮助他们迅速准确地找到自己所需要的档案。

数据更新的及时性。主要指一份档案从形成到纳入数据库之间的时差。如果用户先看到原始档案,然后才从数据库中检索到该档案的有关信息,就会认为数据库所提供的数据不及时。数据库的及时性对于现实效用较强的科技档案尤其重要,数据库的时差越短,其价值就越大。

数据库成本效益。建立数据需消耗大量的人力、物力,租用或购买数据库的话费也太小。因此,经济成本是衡量与选择数据库的重要指标,应尽可能地选用最低的成本达到较大的效益。计算数据库成本的指标包括每个字段、每条记录的平均费用,每次检索、每条命中记录的平均费用。

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20181101B0K80X00?refer=cp_1026
  • 腾讯「云+社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。

扫码关注云+社区

领取腾讯云代金券

年度创作总结 领取年终奖励