我将nltk用于k均值聚类,因为我想更改距离度量。nltkk是否具有与sklearn相似的惯性?似乎在他们的文档或在线上找不到...下面的代码是人们通常如何使用sklearn k means找到惯性的。inertia.append(clusterer.inertia_)
plt.plot([i for i in range(2,26,1)], inertia,
我试图比较不同的聚类算法对我的文本数据。首先计算了余弦距离矩阵(余弦相似度).然后用这个距离矩阵进行K均值和层次聚类(ward和树状图).我想用距离矩阵来表示平均位移、DBSCAN和光学.下面是显示距离矩阵的代码的一部分。vectorizer to synopses
from sklearn.metrics.pairwis
我对集群文本的分析是全新的,我正在使用Goodreads来获取图书概要。我的目标是对类似的书籍进行分组,例如:音乐虽然Goodread提供了体裁,但我想使用概要并使用文本。让我说,我将得到N本书的概要如下:<!basis of what it undoubtedly the grandest epic in science fiction.</des