我有一个由1000个样本组成的L2维数据集,包括5个温度值,5个价格值,一个整数值,代表一个人类专家(undecided=0,good=1,bad=2,danger=4)的判断和一个我想要学习预测的二元决策变量。
我如何找到一个分类器来处理这些异构的数据呢?
我正在考虑为每个可能的人类判断(0,1,2,4),so 4分类器构建一个分类器。因此,对于每个人的判断值,我会:-集中和降低温度和价格值--也许使用PCA来去除一些无关的特征--使用机器学习方法进行分类(比如多层神经网络或支持向量机)。
我的方法正确吗?(如果有1000种可能的人类判断,而不是4种呢?)
发布于 2012-04-27 15:44:59
SVMs或ANNs的一种典型的编码类别方法是1 of -C编码:
一般情况下,几乎每个分类器都能处理异构数据。但您必须对输入进行预处理(缩放、规范化、.)。在我给你的链接中应该有很多提示。
https://stackoverflow.com/questions/10349729
复制相似问题