我一直在试验不同的模式匹配、分析和预测时间序列数据的方法。
因为我没有数据挖掘或相关领域的专业经验,所以我从头开始想出了自己的方法。
在偶尔浏览了几个月的数据挖掘文章(我所理解的为数不多)之后,我意识到我的方法非常基础。
例如,我实现模式匹配的方法是通过多维k最近邻方法。
我现在才开始理解,有一些常用的技术,如决策树、主成分分析、协方差矩阵等,我应该使用它们。
我一直在试验RapidMiner,这是一个图形用户界面数据挖掘工具。RapidMiner允许您拖放复杂技术的各种实现,并将它们连接在一起,而无需编写一行代码。对我来说,这是一个很棒的学习工具。它看起来是这样的:

RapidMiner有一个应用程序接口,但不幸的是它是用Java语言编写的,我现在所有的代码都是用Free Pascal和MySQL编写的。
我正在寻找某种方法将RapidMiner集成到我的应用程序中,这样我就可以通过RapidMiner图形用户界面试验不同的数据处理方法,并在我当前的代码中无缝地使用它们。
如果这不可行,我会满足于另一个数据挖掘包,只要它很容易集成到我当前的Free Pascal代码中。
我研究了R--这似乎是正确的,但它似乎也不容易与Free Pascal集成。
为了清楚起见,我的数据集相当大(500,000+行),并且计算必须实时进行。该软件在Windows 7上运行。
发布于 2011-11-14 18:18:04
我不知道包是什么,但有几个通用的选项:
https://stackoverflow.com/questions/8118156
复制相似问题