Java 编写的开源数据挖掘工具——KEEL

KEEL,Knowledge Extraction based on Evolutionary Learning的简称,是一款开源的数据挖掘软件工具,也是与WEKA一样出名的分析和实验环境,它提供了简洁的GUI,用于执行包括回归、分类、聚类、监督学习等多种数据挖掘任务。KEEL由JAVA语言编写,包含了多种进化算法以及预处理技术与进化学习的整合,这使得它能够对任何学习模型进行完整的分析。

KEEL是一款开源的JAVA软件工具,遵循GNU的GPLv3许可,受西班牙项目(TIN-2005-08386-C05-(01, 02, 03, 04 and 05))的支持 [3]  。

KEEL能够用于大量不同的知识发现任务,它提供了一个简单的基于数据流的GUI,可以根据不同的数据集和计算智能算法(特别是进化算法)设计实验、评估算法。它包含了各种各样经典的知识提取算法、预处理技术(如训练集选择、特征选择、离散化、缺失值处理等)、计算智能的学习算法、混合模型、对比实验的统计方法等等,它允许对各种算法进行完整的分析、比较。

主要特征

  1. 突出了进化算法在模型预测、预处理(特征选择、训练集选择)、后期处理(模糊规则的进化调优)中的作用
  2. 实现了许多专业文献中的数据挖掘算法,如离散化、噪声滤波等
  3. 提供了一个统计库来分析算法结果,库中包含了一组统计测试,用于分析结果的正态性、异态性,比较含参和非参算法的结果
  4. 许多算法是基于JAVA类库进行开发的
  5. 提供了一个用户友好的界面,并且此界面是面向算法分析的
  6. 该工具的目标是设计包含多种数据集和多种算法的实验,并且实验会产生独立的脚本,能够在不同的机器上运行。
  7. 同时提供线下实验和线下实验,线上实验的设计目的是帮助学习者学习算法的操作。
  8. 包含知识提取算法库,其中整合了多种进化学习算法,也包含经典的学习算法。
  • 发表于:
  • 原文链接http://news.51cto.com/art/201901/590852.htm

扫码关注云+社区

领取腾讯云代金券