首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

大数据视域下的高校数据治理

“互联网+”时代的到来,互联网、社交网络、物联网、移动互联网、云计算等相继进入人们的日常工作和生活中,并潜移默化地改变着用户的意识形态。高校信息化被迫要求扮演多元化的角色,对高校的信息化建设提出了更高的要求。《教育信息化“十三五”规划》明确提出要建设“智慧校园”,高校由“数字校园”逐步迈向“智慧校园”,不断探索“以数据为核心资产、以数据驱动业务革新”的发展模式已成为我国高校向“双一流”迈进的必然趋势。数据的体量越大、维度越多,就越能够更好地为用户精准分析和个性化服务提供更多潜在的信息。

在数据挖掘驱动教育、变革教学的“互联网+”时代,教育领域同样蕴藏着具有广泛应用价值的海量数据。探索教育变量之间的相关关系,进行大数据的教育应用,为教育教学提供有效的决策支持服务,促进教育教学的变革与创新,成为十三五期间构建“智慧校园”的新型课题。

高校信息化正面临怎样的问题?

在“十二五”至“十三五”期间,我国高校已基本迈入信息化时代。高校在不断整合业务流程、打破数据孤岛、统筹线上管理、享受信息化建设和快速发展带来丰硕成果的同时,也逐渐面临着数据标准不统一、数据源头不清晰、数据流转不顺畅、数据应用不能满足需求等一系列问题,给教学、科研、管理及服务造成了诸多不便。支撑数据获取不便,或无从获取,或从不同渠道获取数据不一致。在未来“智慧校园”的建设中,高校迫切需要更为便捷的信息化手段支撑教学、科研、管理及服务工作,建立完善的数据服务平台,实现对数据的安全、规范的采集、存储、交换及应用,是实现个性化管理服务的基础。

在上述内在和外在的需求背景下,高校制定统一的数据标准、实现业务系统数据、机器数据及公共数据的高度融合、构建稳定且半开放的数据平台必需且必要。开展数据治理工作,解决当前数据共享中存在的“数据质量不高、数据流向混乱、共享度不足、历史数据缺失”问题,实现对高校数据中心的重构,构建数据治理平台,对高校业务系统数据有序且规范化地进行梳理、采集、清洗、标准化规范存储和应用,实现学校数据资产的有效管理和数据的深度共享。 抽取并整合全校所有业务系统的结构化数据,以及各系统运行日志和互联网数据等非结构化数据,按主题分类进行数据梳理,用于学校在管理、科研、教学及服务改革等业务层面宏观的统计、挖掘、预测。同时,深度治理后的数据能够在教学、科研、管理等多方面全面服务于高校发展,其意义主要体现在:深入促进服务创新和价值创造、有效提升管理和决策水平、提升校园数据质量和数据可信度、提高合规监管和安全风险控制,使高校师生能够充分享受大数据带来的个性化及贴心化服务。

高校教育大数据治理的目标

数据标准规范化

数据标准是在高校数据平台框架下,保障高校内、外部使用和交换数据的一致性和准确性,具有行业特点且共同使用的一种规范性约束。数据标准是高校数据平台数据治理的基础,亦是数据治理建设中的首要环节。一方面,数据标准为高校数据平台提供统一的数据标准定义和平台逻辑模型;另一方面,数据标准是高校数据平台进行数据治理的依据和根本。数据标准是衡量高校数据平台数据资产运营和管理的评估依据。如图 1 所示,数据标准规范化的管理内容包括:构建基于校情的数据管控制度及数据标准管理组织、制定基于数据流程的规范性文件、实现信息项数据字典标准的规范化定义。

数据管理脉络化

通过对数据流的梳理,可以看出数据管理的任务是构建元数据进行集中式的管理。在高校数据范围内,元数据主要描述了各业务系统的数据范围、数据类别、数据定义、数据表之间的关系以及数据流等信息。数据管理是元数据的创建、存储、整合以及控制的一整套流程的集合,用以辅助在高校场景内开展各类元数据应用。

通过对元数据的管理,大数据治理达到如下目标:

提供校级数据字典,便于内、外部准确掌握高校的数据概况;

提供全局元数据查询检索,便于快速定位元数据;

提供元数据详 细描述,便于快速了解数据组成、数据结构及数据流向;

提供血缘/影响分析功能,便于进行分析判断、问题定位;

提供元数据接口服务,便于其它系统或模块使用元数据,实现数据交互与共享服务;

提供元数据应用,方便终端使用元数据。

高校元数据的特点在于逻辑相对趋于集中,即将元数据管理作为统一的发布源,采用集中式的元数据管理模式,提供元数据的集 中创建、维护、查询功能,不断趋于脉络化。

数据质量度量化

数据质量深度反映了数据的“适用性”,即数据满足使用需要的合适程度。数据质量通过完整性、一致性、准确性、及时性、合法性等多类维度进行度量。数据质量的度量化工作旨在定义数据质量标准、建立数据质量审核机制、跟踪数据质量的全生态过程,为数据平台提供洁净、结构清晰的高质量数据,是数据平台开发数据产品、提供数据服务、发挥大数据价值的必要前提,是高校数据资产管理的关键因素。

数据质量度量化的目标是:为高校内、外部用户提供平台化的数据质量监控,通过扩充和优化公共规则库、增强后台对不同类型数据仓库和非结构化数据的兼容性,提升用户使用感受,并提供数据质量应用满足个性化需求。

数据内容精简化

业务数据、系统数据、机器数据、日志数据等形成了高校的结构化数据和非结构化数据集合。数据源的多样性,严重制约了数据交换与共享。数据内容的精简化工作旨在消除重复数据、修正错误数据、实现数据的多次清洗、完成基于数据标准的转化等,以降低数据维护成本。

产权及免责声明:本文系转载编辑文章,对文中观点保持中立,对所包含内容的准确性、可靠性或者完整性不提供任何明示或暗示的保证,不对文章观点负责,仅作分享之用。如果分享内容侵犯您的版权或者非授权发布,请及时与我们联系进行审核处理。本文节选自:CNKI,作者:余鹏、李艳。

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20190220A0S7V500?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券