我正在用分类学习工具箱在Matlab中建立一个logistic回归模型。
我在Matlab中运行了PCA:
coeff,得分,潜伏期,T平方,解释=主成分分析(CreditNumeric);
这是coeff,得分,潜在的和解释的输出:
我想使用PCA的结果来减少我在分类学习器中使用的输入特性(基于我的PCA结果)。如何使用PCA结果来选择(例如5-7)最能描述数据95%方差的特征?
发布于 2019-02-13 22:26:53
这实际上非常简单,因为在Classification learner
中,当您上传所有变量时,您可以选择要用来训练模型的特性(参见“功能选择”按钮出现的最后一个屏幕截图,在导入数据旁边)
在那里,您可以选择任意多个变量,也可以训练几个组合,并在最后比较结果之间的差异。
这里的问题是,我认为如果您的5-7特性(在本例中主要组件)是否描述了95%的数据方差,对吗?
要解决这个问题,您可以遵循两种方法:
-Upload在Classification learner
中将所有变量替换为主组件,并使用PCA按钮表示,在新版本的MatLab中出现了旁边的特性选择一个。
-Then您可以建立解释方差的百分比(95)和分量数(7)
pca
之前在MatLab
,以便您可以看到,控制和分析所有的结果,然后培训的主要组成部分与学习者。通过这种方式,您实际上可以知道您需要在模型中使用多少组件,从而解释95%的差异。而且可能不是5-7,或者可能小于that...explore的第一位。
这是我的建议。祝好运!
https://stackoverflow.com/questions/32552823
复制相似问题