实务:数据库产品

1.数据库产品概念与特征

数据库产品,是指按照特定专业或者学科,汇集海量条目数据,为个人用户或者机构用户提供知识服务的数字内容产品。数据库产品和数字图书馆一样,是目前数字出版业态中主流、典型的数字内容产品。

数据库产品的主要特征如下:

(1)以条目数据为产品构成基本单元。数据库产品的基本单元是条目数据,这些条目数据的信息量大小不一、性质不一,有的属于新闻资讯,有的属于概念定义。有的属于解决方案,有的属于理论研讨专题。由于条目数据的属性不同,按照专业学科或者职业领域的划分也不同,因此,围绕着知识提供和知识服务,以服务特定用户群体为宗旨,形成了内容丰富、体系健全、逻辑严密、规模庞大的知识数据库。

(2)以海量资源聚集为主要表现形态。目前,无论是国内的数据库信息内容提供商,还是国外的数据库供应商,均将海量资源优势作为市场竞争的制胜方略。无论是医学、法律,还是税务、金融领域的数据库,其数据量动辄数百万条,所包含的信息节点往往多达数十亿字符的规模。

(3)以强大的查询检索功能为技术支撑。以海量资源作为内容支撑的数据库,为用户提供便捷知识服务的主要技术便是检索查询技术。目前业态主要是提供关键词的查询检索,也有部分数据库厂商在推广知识导航查询。

(4)数据来源多样化,市场准入门槛相对较低。相对于数字图书馆产品,数据库产品的数据来源较为广阔,不再局限于以标准书号为属性限制的图书,而是可以通过互联网资源抓取、行业资源置换、政府资源合作等多种方式来实现条目数据的扩充;同时,数据库领域的市场准入门槛也相对较低,不再局限于拥有图书专有出版权的出版社,拥有一定的平台技术和专业优势的网络公司均可以进军数据库服务市场,甚至在许多领域,比如法律、医药,民营企业、境外企业的数据库产品远远早于传统出版社的规划和布局。

2.数据库产品的分类

目前的数据库类型很多,有的是泛数据库,有的是精准数据库。以数据库

收录的内容作为依据,可以分为以下三种主要类型:

(1)全文数据库。这种数据库是典型的科技期刊聚合模式,集检索、期刊、文章链接、阅读、下载阅读服务器于一体。全文数据库能检索并且提供全文,提供全文字段检索,方便读者对文献的查询及利用。

(2)二次文献数据库。二次文献是指按照一定的原则,对一次文献进行加工、整理之后,定期出版的一种文献, 如目录索引、引文索引、文摘等。二次文献的原则就是为查找一次文献提供线索,并使一次文献有序化。它具有明显的汇集性、系统性和可检索性,它汇集的不是一次文献本身,而是某个特定范围的一次文献线索。它的重要性在于使查找一次文献所花费的时间大大减少;它能高效率地捕捉有效信息,全面、系统地反映某个学科、专业或专题在一定时空范围内的文献线索,是积累、报道和检索文献资料的有效手段。CA(化学文摘)、MEDLINE (医学文献数据库)、SCI (科学引文索引)、EI(工程索引)、CBM (中国生物医学文献数据库)等都是知名的二次文献数据库,它们具有数据量大、累积性强等特点,常被用于联机情报检索、定题服务、回溯检索。国内的《全国报刊索引》《中国社会科学文摘》《中国物理文摘》也都是典型的二次文献数据库。

(3)混合型数据库。混合型数据库是既包含书目记录又包含全文记录的文献数据库,包括出版物与科学数据混合、出版物与专利混合、按照专业方向的细分内容混合等。

3.数据库的检索

数据库由于内容多、信息量大,如果只利用一般的简单检索,很容易造成漏检、误检。所以在进行数据查阅时需要一定的检索策略才能达到最佳的检索效果,尽可能地使检索提问标识与信息需求以及检索系统保持良好的一致性,提高查询的准确率和效率。目前的数据库检索主要分为:分类导航检索、初级检索、高级检索、专业检索和二次检索。

(1)分类导航检索

分类导航检索是利用导航体系逐步细化,最终检索出最小知识单元中包含的文献的方式。这种检索方式寄托在数据库的分类导航体系之上。数据库将各学科、各门类的知识分为多个检索类型,兼顾各学科之间的内在联系、交叉渗透,分层次对知识按其属性及相互从属关系进行并行或树状排列,逐级展开到最小知识单元。

(2)初级检索

初级检索是指只进行单一字段的检索,可检索字段如篇名作者、文摘、注释、作品关键词等。初级检索能进行快速方便的查询,它为用户提供了详细的导航,最大范围的选择空间。其特点是方便快捷、效率高,但查询结果一般信息量较大,有很多的冗余。

(3)高级检索

高级检索是指利用不同字段进行逻辑匹配的检索方式,能进行快速有效的组合查询,优点是查询结果冗余少、命中率高。对命中率要求较高的查询,一般使用高级检索系统。

(4)专业检索

专业检索主要适用于熟练掌握检索技术的专业检索人员,检索人员根据系统的检索语法编制检索式进行检索。专业检索的一般流程是进入专业检索主页面一选择检索范围一填写检索条件一选择时间范围、期刊范围、记录数、排序方式一开始检索一显示检索结果。

(5)二次检索

二次检索是指在前一次检索结果范围内,继续进行的检索。二次检索可在专项检索的基础上,实现较复杂的逻辑组配检索。在原有的检索结果上进一步筛选,减少冗余,提高检索准确率。一般在初级检索、高级检索和专业检索的结果页面均可以执行二次检索。

每日发布一小节,长按下方二维码,更多形式的资料持续更新

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20180826G1BBMI00?refer=cp_1026
  • 腾讯「云+社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。

扫码关注云+社区

领取腾讯云代金券

年度创作总结 领取年终奖励