首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

信息化的教育使得信息容量急速增加,关于信息的查找以及提取剖析也有了更高的要求

信息时代的降临让咱们面临着海量的信息,于是从这些信息中检索和分分出咱们想要的数据就变得越来越困难,而信息可视化技能以及数据开掘技能却能够协助咱们处理这些洪水般的信息,信息可视化数据检索的优势就在于能够让用户直接参与数据开掘的进程。咱们先来看一下数据开掘以及信息可视化的根本概念。

1 相关概念

1.1信息可视化

信息可视化是现代计算机技能中一个敏捷开展起来的范畴,人们能够通过它来进行视觉信息查找以及相关的信息探究,是“以计算机支撑的、交互的用来表现抽象数据和扩大认知的视觉表明法”[1],信息可视化的信息查找进程是在可视的界面上进行交互的数据浏览以及剖析,用户能够规矩要点或许方向,假如数据信息方针不明确或许信息量少,就能够成为信息检索以及数据库查询的有利弥补。

1.2数据开掘的根本概念

数据开掘DM(Data Mining),也能够称之为数据库中的常识发现,根据Usama、M.Fayyy等给出的界说就是从许多数据中获取有用的、新颖的、潜在有用的、终究可了解的方法的非普通进程[2]。数据开掘就是在许多的数据中提出有用的常识。

2 数据开掘在信息可视化教育中的使用价值

而咱们由以上信息可视化和数据开掘的界说能够看出,把数据开掘使用于信息可视化的教育活动中,也有着十分重要的价值,其首要能够体现在以下几个方面。

2.1教材多媒体化

使用多媒体技能展示出可视化的信息,然后使教育内容更具形象化、动态化以及结构化。教育活动的辅佐东西,比方教材、东西书、电子课件等都呈现出多媒体化的开展趋势,它们不光包含了更为丰富的、大容量的图画和文字,还能够呈现出动画、声响、录像等,乃至包含模拟的三维场景。一般状况下多媒体教材的制造选用的都是二进制的制造、处理和信息的传递,将相关信息附加其主体中,然后为数据开掘供给了完成的可能性;而与传统的纸质教材比较,多媒体课件涉及到的信息量大、方法多样,于是数据开掘技能就应运而生,投合了多媒体课件中对海量信息进行查找和剖析的功用。

2.2 资源全球化

能够说网络资源是全世界最大的教育资源库,不只信息量大,而且资源类型多种多样。其教育资源包含各种教育书刊、大大小小的教育网站、各类虚拟的图书馆、软件库等等,方便了教育作业者进行所需教育资源的查询和使用,可是因为网络资源还存在大而无当、缺少组织性等现实状况,导致网络信息的使用率相比照较低。而且网络技能的开展越来越快,因特网每天都会新增上千万个文件,而且均匀每8个月都会增加一倍,而在全球规划内的服务器数量更是每年都成几许倍数递加[3],在这种状况下的信息查找就好像难如登天。以上状况假如使用数据开掘技能,就能够将海量信息完成数据结构化,然后方便了用户的查找和查询。

2.3 教育个性化

传统的教育活动中教师与学生的沟通是面临面的,教师凭借着经历对学生做出个性特点以及承受才干的判别。而信息化教育则是将学生相关信息的搜集活动由人工的方法转向自动化,智能体系将输入的学生相关信息进行剖析,然后为教育活动供给协助。可是体系毕竟是根据必定的程序规矩编写的,因而给出的信息是仅仅是在必定规矩下构成的,许多时分仍是无法判别其是否精确。这种状况下就能够凭借数据开掘技能,将许多的可视化信息进行深化开掘,然后提取剖析,然后得出更为精确的信息材料。

2.4活动协作化

团队协作才干是现代社会中必不可少的一项根本才干,而协作学习的方法也多种多样,比方凭借计算机进行网上协作学习,或许将计算机作为协作伙伴进行协作学习等等。可是不论哪种协作学习方法,都有许多的信息需求承受或许反应,才干及时的做出判别到达进步才干的意图。假如信息处理不及时或许不稳当,那么面临“泛滥”的信息反而会有信息“匮乏”之感,因而在这种状况下运用数据开掘技能能够将海量的数据信息进行有用的整合及传输。

2.5办理自动化

计算机办理教育体系朝着在网络中树立电子学档功用的趋势开展,电子学档包含了学生的活动记载、身份信息、电子著作以及点评信息等各个模块。电子学档能够协助改革教育点评方法,完成点评活动面向学习全进程的方针。可是实践规划开发中这种做法十分有难度。首要有3点原因:首先是体系剖析处理的特性与学生进行事物处理的特性不同。一个计算机教育体系则相对要杂乱,因而就要用到数据开掘组件将处于同一环境中的两种使用进行和谐处理;其次,一般计算机教育体系中的数据相对涣散,关于信息的搜集和剖析都比较晦气。这时就能够使用数据开掘技能将这些数据集成、整合,并根据学生对信息的反应进行及时的动态更新,终究将这些信息反应给教师;最后,现在许多计算机教育体系关于前史数据的使用率不高,因而如要教师要想在许多的前史数据中找出教育头绪是十分困难的,而且当令数据与前史数据比较较才干够反映出学生的改变状况。因而数据开掘技能的运用就变得十分有必要。

3 数据开掘在信息化教育中的使用难点

榜首,数据开掘还仅仅只是一种信息东西,其效果是通过前史数据来预测出学习者未来的行为,但许多时分其实学习者自身都无法规划下一步详细要做什么,因而,这样的预测只能说一是种概率;第二,数据开掘技能即便能够预测到学生将来的行为,但并不显现预测的根据和进程,即学生为什么会呈现这样的行为等,比方一个课堂上很认真听讲的学生成果却很差等等,这其间的根本原因无法通过数据开掘来完成;第三,数据开掘在信息化教育中的使用还处在开展中阶段,而且数据开掘包含神经网络、人工智能、含糊理论、数理统计等多项技能。别的,学生的学习进程、学习特征和学习成果许多时分都无法用数量的方法表达,所以相对来说要进行数据开掘的开发有必定的难度;第四,学生的特征需求使用数据开掘技能来提取,这就会涉及到文化背景、社会环境以及价值理念等各个方面,因而关于该项技能的开发和使用都有必定的影响。

4 数据开掘在信息可视化教育中的使用规划

4.1教育办理

学生的常识结构和学习风格是在校学生的根本特征。其间,学生正在学以及即将学的常识的把握构建了学生的常识结构,首要包含学生的根底技能、当时技能以及方针技能三个方面;而学习风格则更侧重于学生的社会特征、心理特征以及生理特征等。数据开掘技能能够通过对学生状况的把握以及学生特征的剖析,到达协助学生批改学习行为的意图。将学生的特征剖析成果与行为方针规范做比较,学生根据比较的成果进行学习行为的批改,完善品格、进步才干。而且计算机在教育办理方面的使用越来越广泛,教师以及学生的各种信息,比方作业、学习、处分以及奖赏等都被贮存在教育办理数据库中。所以使用数据开掘的演化剖析以及相关剖析,能够在数据库中开掘出更有价值的数据,然后剖析学生的日常行为,找出行为之间的内在联系。

4.2教育点评

教育点评的进程,就是根据教育的一般规矩和教育大纲中拟定的方针要求,通过体系搜集相关信息,对教育活动和教育成果进行价值的判别。其首要内容是对学生“学”的点评以及教师“教”的点评。现在我国高等院校的点评方针首要以学生的课堂教育点评方针以及综合测评方针为主,可是却无法精确的判别出各方针的重要程度、它们之间的相关性以及方针的存在是否合理等状况。假如将数据开掘中的相关规矩模型以及粗糙集理论用于点评体系中,就能够对方针进行约简、排序,优化点评方针,然后找出更为简略易行的、科学的点评方法[5]。此外,学习点评也归于教师的重要职责,对学生的学习行为进行科学点评,既能够激发学生的学习动机,又能够通过学生所反应的信息检查教育程序、课程计划等。使用数据开掘技能对学生的行为记载、学习成果、奖赏处分等各个数据库的信息进行处理剖析,及时得出对学生的点评成果,如有偏差做出及时的纠正,还能够战胜人为点评中不客观、不公正的缺陷。

4.3课程设置

高校的课程设置一般都是遵从“先根底、后专业”的规矩,进行按部就班的学习。不过即便一般规矩是特定的,每个学期的课程也不能原封不动,因而要合理的设置每学期的课程,既要使其遵从一般的教育规矩,又要契合学生的实践状况。比好像一课程由不同专业的学生学习时,其整体成果会相差较大。这时能够将教育数据库中寄存的前史成果,使用数据开掘的时刻序列以及相关剖析功用,从前史数据中开掘出相关信息,并剖析其间的回归性、相关性,然后找出具有价值的信息以及规矩,终究得出影响学生成果的真实原因[6]。

4.4教育进程与教育方法

在一门课程的教育活动中,教师一般会使用多种教育方法完成教育方针,比方事例法、试验比照法、讨论法、观赏学习法、查询法以及多媒体辅佐法等。这些教育方法通过许多学生、多个班级以及不同教育任务的实践后,贮存在教育数据库中。能够使用数据开掘技能,对数据库中的相关数据进行深化开掘和剖析,然后找出对应专业能够采纳何种教育方法,能够更好的满意教育要求。这种方法能够协助学生有用的吸收和了解相关专业常识。当课程完毕今后,再把每个学生的成果结合教育方法的点评,运用数据开掘中的相关规矩以及回归线性剖析做出判别,这种方法关于分层教育、分类教育都有着十分重要的指导含义和推行含义。

5 数据开掘在信息可视化教育中的详细使用

咱们以数据开掘技能在信息可视化教育中的教育点评为例,来阐明其详细使用。

5.1搜集数据

5.1.1 数据集成

把来自多个不同数据源的数据进行集成合并,将数据搜集所得到的多个不同的数据库文件,使用相关的数据库技能生成剖析学生成果信息的根本数据库。

5.1.2 数据整理

数据整理最首要的作业,就是对遗失的数据值进行弥补。因为学生的成果信息根本数据库中很有可能缺少咱们所需求的、对研讨有所协助的特点值,所以,咱们能够使用数据整理技能来弥补这些空缺。

5.1.3 数据变换

数据变换是针对数据做规格化的操作。因为除了单个的接连值特点外,大部分均为离散值特点,因而要把接连值特点作离散化处理。能够选用概念分层技能,把接连值特点离散化。直方图剖析法是一种相比照较简略的离散方法,其分为等深分箱以及等宽分箱两种。

5.1.4 数据消减

数据消减的首要意图就是缩小开掘的数据规划,但对开掘成果却不会形成影响。能够使用消减维数法,从初始的特征特点中查找有用的特征特点,然后削减开掘时需求考虑的变量个数或许特征特点。

5.2数据分类开掘

其目是就是为进一步树立成果剖析决策树的模型而做。一般在训练集相对较小的状况下,分类开掘能够选用C4.5或许ID3算法,本文选用ID3算法。

5.2.1 ID3算法

该算法从决策树的根节点的训练样本开端,挑选一个特点对这些样本进行区别,每一个特点值都发生一个分支,再把分支特点值的相关样本子集移至新生的子节点。这种算法递归的使用于各个子节点,直至一个节点中所有的样本都被分配至某类中。ID3算法选用的是由上至下、分而治之的递归方法构建决策树。

5.2.2 特点的挑选

能够选用信息增益的方法来挑选特点。一般挑选有最高信息增益的特点,作为当时的节点测验特点,然后保证了在对训练样本子集分类时的信息最小化,保证决策树的结构最为简略。

6 结论

总归,信息化的教育使得信息容量急速增加,关于信息的查找以及提取剖析也有了更高的要求。使用传统的查找技能从海量的信息中找出决策根据,变得越来越困难。因而咱们必须凭借数据开掘技能,找出海量信息中躲藏的方法或许规矩,然后为信息可视化教育供给愈加有力的技能支撑。虽然作为一种东西,数据开掘不可能替代教师的效果和位置,可是它却为教师的决策剖析供给更为科学和简洁的根据,为传统教育中难以获取的教育模型的树立供给了更为便捷的途径。

  • 发表于:
  • 原文链接http://kuaibao.qq.com/s/20180129A0JEFZ00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券