我正在尝试使用https://github.com/wwbp/facebook_topics/tree/master/csv的2000个主题的前20个频率数据
我想对数据执行randomizedPCA。在文档中,X需要是类似数组的形状(n_samples,n_features)。
我已经用LDA_topics = pd.read_csv(r'2000topics.top20freqs.keys.csv', header=None, index_col=0, error_bad_lines=False)
导入了该文件
但是,这不是以下行的正确格式:
pca2 = sklearn.decomposition.RandomizedPCA(n_components=45)
pca2.fit(LDA_topics)
导致出现ValueError:无法将字符串转换为浮点数:'sonic‘
有没有一种方法可以在执行PCA后保留特征标签,而不仅仅是频率?
https://stackoverflow.com/questions/53661114
复制相似问题