我有以下用SciPy制作的树状图:
# create the dendrogram
from scipy.cluster import hierarchy as hc
from scipy.stats import spearmanr as sp
import matplotlib.pyplot as plt
%matplotlib inline
corr = np.round(sp(data_for_cluster).correlation, 4)
corr_condensed = hc.distance.squareform(1-corr)
z = hc.linkage(corr_condensed, method='average')
fig = plt.figure(figsize=(20,35))
dendrogram = hc.dendrogram(z, labels=vals_to_keep, orientation='left',
leaf_font_size=14)
plt.show()它给出了以下情况:

我不太清楚如何解释树状图中的颜色。在文档中,它给出了对color_threshold参数的以下描述:
为了简洁起见,让我们来做color_threshold。将簇节点下面的所有子代链接都涂上相同的颜色,如果k是剪裁阈值t以下的第一个节点。所有连接距离大于或等于阈值的节点的链接都是蓝色的。如果t小于或等于零,则所有节点都为蓝色。如果color_threshold与MATLAB(TM)行为相对应,则阈值设置为0.7*max(Z:,2)。
然而,让我困惑的是为什么一些看起来非常接近的星系团没有给出不同的颜色,而其他的星系团则是进一步的apart.......do。
我认为,在其他条件相同的情况下,更紧密的集群在一起的可能性越大,它们就越有可能成为不同的颜色,以表示集群成员资格,但情况似乎并非如此。
发布于 2022-06-02 14:32:47
我相信,如前所述,树状图中的着色是基于阈值0.7_max(Z:,2)的。第一簇为绿色,第二簇为黑色,这种着色一直持续到阈值达到。所以在其他颜色上。这意味着0.7_max(Z:,2)阈值树状图显示相同的颜色。
https://stackoverflow.com/questions/57529382
复制相似问题