首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

基于大数据技术的科技信息服务系统研究与建设

摘要

在以全球化、知识化、信息化为主要特征的知识经济时代,企业创新更多的依赖于企业发现、获取、挖掘、传播和运用知识的能力。面向企业的科技信息服务系统的建设成为目前解决知识管理、知识服务、支持科学决策的重要手段。本文以主导企业科技信息服务平台为主要目标,介绍了数据基础、功能设计及数据处理的企业科技信息服务模式,为打造新一代综合性科技情报服务平台,助推企业技术创新提供参考。

一、引言

在知识经济时代,知识成为企业生产力和生产成果的最基本要素,对知识的创新和应用能力成为企业的核心竞争力。企业想在更高层次上实现新一轮发展,根本出路仍在于提高自主创新能力,加快由投资驱动和资源消耗为主向创新驱动转变,企业的创新速度和层次不再简单依赖于资本的投入,更多的依赖于企业发现、获取、挖掘、传播和运用知识的能力。

随着信息处理和知识挖掘技术的进一步发展与创新,粗粒度的知识获取变得相对容易,但精细化的知识需求越来越难以得到满足。用户对信息的需求正逐步向技术化、知识化、个性化的方向发展。一般的文献传递及文献获取已不能满足企业用户技术创新的需求,目前,如何从数量庞大的数据环境中提取及分析所面临的信息需求,并形成支持决策的知识资源,成为解决企业所面临问题的重要途径,也成为信息资源服务机构的重要使命。

目前国内现有的信息服务系统大多还是建立在文献资源的展示上,在服务功能上只是一个文献资源的展示平台,实现了信息的有序浏览和统一检索,但缺乏“大数据”时代下必要的整合、挖掘、分析、评价等功能,不能有效地满足用户对知识的需求(胡维健.竞争情报系统商业软件甄别方法[J].图书馆杂志,2005,24(6):10-15.)。因此,为了从更大程度上贴合企业知识服务需求,对企业进行技术创新提供指导与协助,本文提出建设科技信息服务平台,力求在文献资源展示的基础上进行知识服务的扩展,为各个行业领域、产业机构提供专业的信息服务。

二、大数据与科技服务

大数据是知识时代服务于科技创新的重要基础战略资源,是科技信息服务的重要前提与基础所在。基于大数据的科技信息服务是面向智慧服务和技术创新需求的个性化服务,是信息服务机构服务于企业科技创新过程的升值服务。“大数据”时代,在商业、经济等领域,决策将日益基于数据和分析,颠覆了基于经验和直觉的模式(应璇,孙济庆.面向大数据的用户检索行为研究[J].情报杂志,2014,33(2):140-141.)。原因在于大数据不仅仅只是量“大”,还具有随机、分散、多样化的特点,价值密度较低,传统的数据统计分析技术已无法满足普遍的信息需求。从而,科技服务的整体目标需要从数据导向积极转型于知识导向,这就要求从各类大数据的显性和隐性知识资源中按照不同的知识要素有针对性地提取所需的关键数据和知识,辅以特定的文本挖掘与知识关联技术,依据特定用户群体的需求开展个性化知识应用场景服务,以解决科研人员在创新研究过程中的信息需求问题。

因此科技信息服务系统的建设过程将始终遵循科技资源数据为主线,以知识挖掘为辅助,以资源服务为重点,为用户提供更智能的科技创新服务解决方案。

三、设计目标

日前,“创新”的概念已被摆在与改革开放同等重要的位置,政府工作报告中指出,要落实和完善高新技术企业扶持等普惠性政策,鼓励企业增加创新投入;对中小微企业,要“扶上马、送一程”,使“草根”创新蔚然成风,遍地开花。但中所周知,中小企业力量相对薄弱,创新环节需要众多方面来自各个环节的支撑,知识作为创新的基本元素,首要解决的问题则是现有信息情报及知识的获取能力、分析能力及服务能力。因此,面向企业的科技信息服务系统的建设应是基于知识管理、面向知识服务、支持科学决策的新一代综合性科技情报服务平台。主要设计目标如下:

1. 加强中小企业数据资源需求分析

知识服务的效果取决于对企业用户需求的定位程度。企业用户的知识信息需求呈现出综合化、开放化、高效化、个性化的特点(石慧.高校图书馆为中小企业提供知识服务探析[J].科技情报开发与经济, 2010, 20(34): 31-33)。如:企业管理者需要的是本行业领域内的发展现状、竞争对手的科技创新能力评估等,这类信息来自于统计加工、评价分析之后可用来指导决策的深度信息;企业研发人员需要最新的科技文献类信息;市场分析人员需要及时准确的前沿科技、政策法规以及市场信息。相对应的企业知识服务需求也演变为战略需求、知识需求及业务需求。为满足不同层面用户的多元化个性化知识需求,科技信息服务系统必须有相对全面的数据类型基础以及足够成熟的知识获取、重组、分析能力,才能够围绕企业发展过程中的各项进程提供针对性的服务。

2.加强知识服务工作中的知识管理

企业知识服务工作的基本任务是以企业需求为目标,以大量的数据和知识为基础,以完善的知识管理技巧为支撑,借助于先进方法和技术,开展项目申报咨询、企业经营管理、市场营销策划、专利技术开发等服务内容(周瑞云等.加强中小企业知识服务的探讨[J].研究探索, 2010, 23(293): 1-3)。知识管理应基于一套系统的元数据,使得异构数据库的统一检索和结果集合成为可能,实现将不同元数据类型与系统元数据的映射以降低知识管理风险。

3.丰富信息资源服务功能

信息资源服务功能除了应包括现有的通用基本服务功能,如统一检索、资源导航、文献传递等,还应开发各项个性化专业服务功能,实现技术热词的统计追踪、项目申报流程支持、前沿科技发展趋势分析等功能。同时结合主导产业科技情报的共性化需求,针对科技成果、产业专题、科技查新、科技评估、参考咨询等方面进行强化服务。

四、平台技术架构

根据整体平台项目的建设目标与内容,设计了项目的整体技术框架。该框架依托知识生产的流程进行总体设计,主要包括数据源基础、知识管理、知识服务及应用等几个主要部分(见图1),后文将针对具体的三个层次进行详细探讨。

五、数据源基础

一般情况下,科技信息服务系统平台的数据源基础涉及广泛,资源类型主要涵盖为以下三个方面:文献资源,如期刊、学位、会议、专利、标准等,重点解决企业技术创新过程中的技术研发前端需求;特色数据库,如科技成果、统计数据、产业情报、决策参考、科技发展报告、声像、电子期刊、科普类数据(今日科技、创新故事、科技照片)等,重点解决产业行业内现状信息需求;开放资源,如政策法规、平台动态、互联网采集的资源等,重点解决动态新闻、科技前沿类信息需求(见图2)。

根据上述资源构成,平台的数据生成体系也相对应分为三层:海量仓储,主要是外购资源数据库,解决有版权的数据资源问题。定量生成,即通过平台建设和相关激励制度,普及网络学习和网络工具应用,帮助平台用户利用网络,定时收割各个资源共建部门或个人的内部知识成果资源。批量采集,通过固定的数据采集和收割方法,解决免费资源的收录和固定来源的数据渠道的加工。最终形成的数据源基础如下:

1.内部知识成果

内部知识成果是指信息服务机构日常科研、生产、经营管理过程中产生的有价值的、经过科研人员加工的技术成果。该部分资源的整合首先需要通过规范统一标引的方式,对该类数据进行预处理,按照信息规划体系对其分类。该类资源按照对应的专题分类通过平台进行发布,实现知识共享。同时通过该操作可以逐渐累积信息,构建最终的内部知识库。随着该知识库在数量和质量上的扩充,平台将成为平台内部获取知识的最重要途径。

2.外购资源

对外购资源库的整合,通过“网络爬虫”技术对原数据库页面进行抓取,获得标引字段、摘要信息等数据,再通过统一标引的方式,根据国家图书分类标准构建格式统一的元数据。

3.互联网信息资源

利用互联网资源采集工具,对指定网站进行定向采集,并以专题库的形式存储。

六、知识管理

知识管理层是科技信息服务系统的核心,它基于数据源基础层进行知识的挖掘与分析,同时也是知识服务与应用层的重要技术支撑。其主要实现利用科技文献信息进行资源整合、数据处理、资源管理,整合数据源基础所覆盖的所有数据,包含自动过滤、智能分类、自动标引、聚类统计、模板管理、资源导航等,最终形成完善统一的知识处理中间件环节(见图3)。

1.资源导航

平台资源导航提供基于数据仓储的多学科、多种类的文献资源导航功能:期刊导航、学位论文导航、会议论文导航、科技成果导航、中外标准导航、中外专利导航以及法律法规导航等,满足企业用户的多元化信息分类导航需求,实现信息资源的快速一站式获取。

2.知识管理

科技信息服务系统的知识管理功能需要具备多类型、多角度、多分类的知识管理结构,主要包括针对文本信息、图片信息、多媒体文件等不同数据类型的数据基础管理、针对知识资源共享的文章管理及流程控制、动态关联管理、热点发现、分类管理、模板管理以及知识目录管理等功能。

七、知识服务与应用

知识服务与应用层是整体科技信息服务系统的外在体现,是系统用户接受知识服务的最直接的方式,也是关系到针对企业开展科技信息服务效果的重要因素。因此,在开展知识服务前应准确把握企业用户的知识信息需求,选取目标市场,了解用户的信息需求、信息获取渠道和信息利用方式,挖掘其隐性需求,并最终确定知识服务的方式及策略。根据上文所述需求,我们将知识服务的方式列举如下,主要包括以下几个方面:

1.原文传递服务

原文传递服务是将用户所需要的文献以有效合理的方式,直接或间接传递给用户的一种非返还式文献提供服务,它具有快速、高校、简便的特点。通过开展文献传递服务,不仅缓解了企业资源不足、经费有限以及资源需求者日益增长的文献需求之间的矛盾,同时是科技信息服务的重要保证。

系统实现面向注册用户提供的网络化原文请求特色服务。该服务依托科技信息服务机构为服务调度,提供跨域的原文共享功能。目前科技信息服务系统的文献传递服务主要包含两种模式:自助原文传递、联合原文传递。自助原文传递是指用户针对平台的部分题录信息,可以提出原文传递申请,由平台自动或管理员手动的方式对用户原文请求进行处理。而联合原文传递是通过某种中介机构,通过统一发布,实现“谁服务、谁受益”的服务模式,真正做到了服务供需双方的中介撮合。

2.定题服务

定题服务是指根据用户特定需求而开展的全程文献检索服务。通过这种服务,可使企业用户及时了解和掌握有关科研项目或课题的研究现状,并能帮助其追踪课题、专题研究的最新发展动态。针对自然科学、人文社会科学等各个学科领域的各种研究课题开展定题服务,为用户提供从课题前期调研、开题立项、项目进展中和成果验收的全过程的文献检索服务。

3.参考咨询

参考咨询服务包括实时参考咨询、非实时参考咨询、常见问题解答等功能模块。通过实时参考咨询,可以实现实时互动;通过非实时参考咨询,可以实现用户问题离线解答;常见问题解答则可以将一些共性问题进行发布,方便用户检索和查找问题解答。

4.科技查新

科技查新服务是专门面向平台中有科技查新需求的企业用户提供的在线文献特色服务。该服务能够为平台使用单位的查新部门提供自动化的查新需求收集、查新报告生成等服务。

5.产业服务

平台可依托传统文献资源和各地行业、产业、区域特色资源,面向区域特色人群,提供特色产业服务。服务内容包括:行业产业监测服务,情报工作人员结合平台特色产业资源,在线完成行业、产业监测分析,为用户提供产业监测分析报告;定题产业情报服务,情报工作人员结合平台特色产业资源,在线完成企业所需的产业情报分析,为用户提供定题情报推送服务;专家加盟,区域内专家通过分中心加盟,形成“专家学术圈”,在圈内共享文章、发布观点、提供咨询服务;个性化产业资源服务,机构或个人用户灵活配置资源需求主题,平台结合产业信息,实时推送最新内容到终端。

6.科技创新服务

平台可基于现有文献资源,依托先进的中文信息处理技术、知识挖掘技术与自动分类、聚类技术,对海量科技文献信息进行挖掘和分析,提供科技创新辅助决策支持服务。服务内容包括:机构科研能力分析,根据机构的科技论文、专利、科技成果产出状况以及机构承担国家科技项目情况,全面揭示机构的科研水平和创新实力;人物科研能力分析:根据人物的科研产出总体情况、人物科研协作关系、人物主要研究领域以及相关媒体报道,丰富详实地展现专家的主要研究方向、科研成果、行业经验与背景;主题研究分析,根据主题的基本属性,全面揭示主题相关的各类科研产出情况以及相关产品和服务,并通过主题相关的创新实体分析,为用户推荐权威的研究机构和行业领域专家;学科科研分析,对学科相关的研究机构、研究专家进行挖掘和分析,帮助用户寻找和了解学科权威研究机构和重点研究专家等。

八、结论

综上所述,面向企业技术创新的科技信息服务系统的建设应以解决企业科研过程中的具体问题为出发点,以协助企业创新为最终目标,针对企业知识需求的特点,提供个性化的知识服务解决方案,依据系统平台及现有的信息挖掘机处理技术,深度挖掘知识资源,主动推送知识解决方案,满足企业用户多方位的个性化需求。

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20190823A0KTZ700?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券