首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >预处理螺旋数据集以用于Logistic回归

预处理螺旋数据集以用于Logistic回归
EN

Stack Overflow用户
提问于 2021-07-12 05:48:43
回答 2查看 36关注 0票数 0

因此,我需要对螺旋数据集进行分类。我一直在试验一系列算法,如KNN,Kernel SVM等。我想尝试使用特征工程,预处理等来提高Logistic回归的性能。

我也在使用scikit learn来做所有的分类。

我完全理解Logistic回归不是解决这类问题的合适算法。这更像是对预处理和其他特征工程/提取方法的学习练习,看看我可以在多大程度上改进这个特定的模型。

以下是我将用于分类的示例数据集。任何关于如何操作数据集以在Logistic回归算法中使用的建议都将是有帮助的。

我也有多个螺旋线的数据集。有些数据集有2个类,有时多达5个。这意味着最多有5个螺旋。

EN

回答 2

Stack Overflow用户

回答已采纳

发布于 2021-07-12 09:03:41

Logistic回归通常被用作线性分类器,即将一类样本与另一类样本分开的决策边界是线性的(直线),但它也可以用于非线性决策边界。

在SVC中使用内核技巧也是一个很好的选择,因为它将较低维度的数据映射到较高维度,使其可线性分离。

示例:

在上面的例子中,数据在较低的维度上不是线性可分的,但是在应用转换ϕ(x) = x²并将第二个维度添加到特征之后,我们得到了变为线性可分的右侧图。

您可以通过创建应用逻辑回归的新功能来开始转换数据。也可以尝试使用内核技巧的SVC(支持向量分类器)。对于SVC,您不必显式地将数据转换为更高的维度。

对于学习很有帮助的资源有onetwo

票数 0
EN

Stack Overflow用户

发布于 2021-07-12 06:14:32

由于数据似乎不是线性可分的,您可以尝试使用支持向量分类中常用的内核技巧方法。核函数接受原始低维空间中的输入,并返回转换后的向量在高维空间中的点积。这意味着变换后的向量ϕ( x )只是相应低维向量x中坐标的某个函数。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/68340134

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档