我得到了坏的集群,我想用一种方式重写它,这样我就可以插入我想要的任何算法(例如,分层,knn,k-means)等。dictionary and returns clusters in an indexed list""" Transform texts to Tf-Idflabel in enumerate(km_model.labels_):
我尝试使用word2vec加权tfidf向量进行DBSCAN聚类,并对DBSCAN使用了不同的epsilon和minpts阈值。我也尝试了光学聚类方法和不同的分钟,但它没有产生任何输出。is the max of max_idf = max(tfidf.idf_)
return defaultdict