因此,我需要对螺旋数据集进行分类。我一直在试验一系列算法,如KNN,Kernel SVM等。我想尝试使用特征工程,预处理等来提高Logistic回归的性能。
我也在使用scikit learn来做所有的分类。
我完全理解Logistic回归不是解决这类问题的合适算法。这更像是对预处理和其他特征工程/提取方法的学习练习,看看我可以在多大程度上改进这个特定的模型。
以下是我将用于分类的示例数据集。任何关于如何操作数据集以在Logistic回归算法中使用的建议都将是有帮助的。
我也有多个螺旋线的数据集。有些数据集有2个类,有时多达5个。这意味着最多有5个螺旋。
发布于 2021-07-12 09:03:41
发布于 2021-07-12 06:14:32
由于数据似乎不是线性可分的,您可以尝试使用支持向量分类中常用的内核技巧方法。核函数接受原始低维空间中的输入,并返回转换后的向量在高维空间中的点积。这意味着变换后的向量ϕ( x )只是相应低维向量x中坐标的某个函数。
https://stackoverflow.com/questions/68340134
复制相似问题