我曾将t-SNE用于KMeans集群,但在获得t-SNE result后,我无法理解如何将其与原始数据关联起来。有人能帮我理解一下结果吗?我应该怎么做才能通过与我的原始数据进行比较来更好地理解结果?
from sklearn.manifold import TSNE
fig, ax = plt.subplots(figsize = (10,8))
data = df2[['First_Policy_Year','Customer_Age','Educational_Degree','Customer_Monetary_Value','Total_Premium']].values
kmeans_clustering = KMeans( n_clusters = 3 )
idx = kmeans_clustering.fit_predict( data )
#use t-sne
X = TSNE(n_components=2, perplexity=10).fit_transform( data )
#fig = plt.figure(1)
#plt.clf()
#plot graph
colors = np.array([x for x in 'bgrcmykbgrcmykbgrcmykbgrcmyk'])
plt.scatter(X[:,0], X[:,1], c=colors[kmeans_clustering.labels_])
plt.title('K-Means (t-SNE)')
plt.show()
发布于 2018-06-26 08:42:30
在我看来,这个随机结果看起来像是随机的。
检查此highly voted answer on stats.SE。第三张图片显示了比你的更多的结构-它被显示为错误的结构……
不要过度解读它。不管怎么说,这可能是错误的。
首先改进你的预处理。您90%的工作将是数据准备。
https://stackoverflow.com/questions/51022679
复制相似问题