请评论一下,任何批评都是受欢迎的。
发布于 2017-03-21 11:13:55
您使用的降维方法与用于分类的方法无关。在训练任何类型的分类器之前,你可以使用PCA对你的数据进行预处理,如果你想使用人工神经网络的话,你可以使用它。
发布于 2017-03-21 12:01:00
如果您的数据由行中的观察组成,而且每一列都是该观察的变量,则可以调用这些列维度。这些也可以称为观测的特征。
从数据集中删除列/特性本质上是降维。从高维空间到低维空间(更少的列)。事实上,你没有结合特征,旋转空间并不意味着它不是一种有效的降维形式。
为什么你反对在神经网络中使用PCA?PCA不关心你所追求的是哪种分类。实际上,R的插入包中有一个方便的函数,在神经网络之前实现主成分分析,以简化神经网络的计算。
发布于 2017-03-21 16:11:00
从数据库中提取的数据集包含50多个列。
你可以称他们为特征。功能集是你操作的东西。
显然,我必须对它们进行降维。但是,由于PCA算法和其他算法一样,通常会进行轴旋转来生成一些新的轴。我认为我不会在降维中使用PCA算法。
我不确定你是否完全理解PCA。PCA不生成新的随机轴,而是表示数据最大方差的轴。因此,PCA一定会执行维数约简,因为数据有一些不向模型添加信息的值。您可以将此特征提取或特征筛选称为
我之所以不使用PCA算法,是因为我想实现神经网络分类,而且我需要实际的参数。
是什么让你思考,在PCA后你没有“真实”的参数。这只是相同数据的不同视图(假设这些轴是眼睛,数据是对象,您只是对同一个对象有不同的视图)。
我看到的唯一问题是,分量投影的轴是正交的,如果您想避免,可以继续使用ICA (独立分量分析)。
https://datascience.stackexchange.com/questions/17727
复制相似问题