我想用原始文件的要点创建一个摘要。为此,我使用通用句子编码器(https://tfhub.dev/google/universal-sentence-encoder/2)进行了句子嵌入。之后,我想对我的向量应用聚类。
我尝试过使用库sklearn:
import numpy as np
from sklearn.cluster import KMeans
n_clusters = np.ceil(len(encoded)**0.5)
kmeans = KMeans(n_clusters=n_clusters)
kmeans = kmeans.fit(encoded)但是我得到了一个错误消息:
'numpy.float64' object cannot be interpreted as an integer'发布于 2019-10-08 21:08:21
问题是由下面这行引起的:
n_clusters = np.ceil(len(encoded)**0.5)kmeans期望收到集群数量的integer,因此只需添加:
n_clusters = int(np.ceil(len(encoded)**0.5))https://stackoverflow.com/questions/57182093
复制相似问题