我基于TFIDF向量器对文本数据进行聚类。代码运行得很好。它将整个TFIDF向量器的输出作为K均值聚类的输入,并生成散点图。相反,我只想将基于TF-IDF分数的前n个术语作为输入发送到k-means聚类。有没有办法做到这一点?(n_components=pca_num_components).fit_transform(x)
for index, instance inenumerate(reduced_data):
我目前正在使用Pandas和matplotlib来执行一些数据可视化,并且我希望在我的散点图中添加一条最适合的行。这是我的代码:import matplotlib.pyplot as pltimport numpy as npdef PCA_scatter(filename):
data = panda.r