问为LDA pca保留csv要素标签
EN

Stack Overflow用户

提问于 2018-12-07 07:16:21

回答 2查看 125关注 0票数 1

我正在尝试使用https://github.com/wwbp/facebook_topics/tree/master/csv的2000个主题的前20个频率数据

我想对数据执行randomizedPCA。在文档中，X需要是类似数组的形状(n_samples，n_features)。

我已经用LDA_topics = pd.read_csv(r'2000topics.top20freqs.keys.csv', header=None, index_col=0, error_bad_lines=False)导入了该文件

但是，这不是以下行的正确格式：

pca2 = sklearn.decomposition.RandomizedPCA(n_components=45)
pca2.fit(LDA_topics)

导致出现ValueError:无法将字符串转换为浮点数：'sonic‘

有没有一种方法可以在执行PCA后保留特征标签，而不仅仅是频率？

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/53661114

复制

相似问题

问为LDA pca保留csv要素标签EN