如何让大型数据集的聚类热图看起来更好？ - 腾讯云开发者社区

r、pheatmap

我根据基因微阵列数据创建了一个热图，然后使用pheatmap对数据进行聚类并输出热图。有没有办法将热图的聚类数据以矩阵形式输出到excel文件中？

浏览 2提问于2015-09-25得票数 0

1回答

只有一列的R热图

我有一个只有1列但超过5000行的数据集。当我尝试运行heatmap(data)命令时，我看到一个错误，告诉我'x‘必须至少有2行2列。有没有一种方法可以让热图绘制单列热图？谢谢

浏览 0提问于2013-04-02得票数 3

回答已采纳

6回答

如何使用固定的外部层次集群创建热图

r、heatmap、hierarchical-clustering

我有一个矩阵数据，并想用热图可视化它。这些行是物种，所以我想可视化系统发生树，并根据树对热图的行进行重新排序。我知道R中的heatmap函数可以创建层次聚类热图，但是我如何使用我的系统树聚类，而不是在图中默认创建的距离聚类？

浏览 4提问于2013-03-01得票数 5

回答已采纳

2回答

你使用什么方法来选择k-means和EM中的最佳聚类数？

r、cluster-analysis、data-mining、expectation-maximization

有许多聚类算法可用。一种流行的算法是K-means算法，其中，基于给定数量的聚类，该算法迭代以找到对象的最佳聚类。在k-means聚类中，您使用什么方法来确定数据中的聚类数？ R中是否有可用的包包含用于确定正确的集群数量的V-fold cross-validation方法？另一种常用的方法是期望最大化(EM)算法，该算法为每个实例分配一个概率分布，该分布表示该实例属于每个集群的概率。这个算法是在R中实现的吗？如果是，它是否具有通过交叉验证自动选择最佳聚类数量的选项？您是否更喜欢其他的聚类方法？

浏览 1提问于2010-02-23得票数 13

1回答

如何在Matlab的生物信息学工具箱中使用聚类图的其他聚类方法

oop、matlab、bioinformatics、hierarchical-clustering

编辑:我想明白了。只是不懂符号。你好, 希望有人熟悉生物信息学工具箱中的聚类图。我对该函数的图形方面(树状图/热图)感兴趣，但由于它要求我使用Matlab的集群()函数，所以目前有缺陷。我更喜欢用我的个人算法进行聚类，然后允许Matlab为我可视化这一点。我已经搜索了代码，但是对于面向对象的编程，特别是Matlab的版本，我非常无知。因此，我所知道的只是函数调用行'obj =obj.get群集‘，但是不知道如何编辑它，因此我使用自己的聚类算法而不是Matlab的聚类算法。任何帮助都是非常感谢的！编辑:我正在专门研究一种新的算法，因此我不需要pdist或链接。树状图是在聚类图函数

浏览 7提问于2010-10-20得票数 0

1回答

如何打印空相关矩阵

python、pandas、missing-data

我有一个训练集，它有400个特性，其中大多数都有空值。我试图用Pythonandmissingno绘制无效相关矩阵的热图，但是由于功能数量多，热图无法读取。我如何打印无效相关矩阵，而不是绘制它？

浏览 0提问于2019-10-18得票数 0

回答已采纳

1回答

生成人口热图: Mapreduce？

php、google-maps、hadoop、mapreduce、postgis

我有一个MySQL表 (1亿)美国各地点的Lat/Lng坐标居住在该地点半径平方英里内的人数问题:在地图或Openstreetmaps上生成和叠加热图之后，居住在平方英里半径内的人数必须在地图上的任何点确定，无论鼠标光标位于哪里。(可以使用相邻数据点的简单平均值) 你是如何生成这样一个热图的？建议使用Mapreduce吗？初思热图必须是预渲染的服务器端。将所有必要的点下载到浏览器，然后生成热图客户端可能是一个问题:必须从数据库中检索大量坐标(沉重的数据库负载)并将其传输到浏览器(大型数据集)，而且浏览器还必须处理大量的点数才能生成热图。这太慢了，所以我想我们

浏览 0提问于2013-03-22得票数 2

回答已采纳

1回答

如何保持集群映射索引顺序与我的DataFrame索引顺序相同

python、dataframe、plot、heatmap

我正在尝试使用python Sea born包绘制集群图我希望热图的行顺序与DataFrame索引顺序相同但图像似乎不是这样的我的数据具有如下特征： data‘’character‘= 'A'，'B'，'B'，'C'，'C’ 我使用颜色条来显示字符如果聚类图的顺序与我的数据帧的顺序相同在我的颜色栏中有相同的字符但事实并非如此如何才能使聚类映射顺序与数据帧索引顺序相同非常感谢

浏览 2提问于2018-03-06得票数 0

1回答

相似矩阵上的图和热图

r、heatmap、hierarchical-clustering、dendrogram

我已经为数据的成对比较计算了一个相似矩阵，我希望使用分层聚类和热图来可视化数据。热图不是一个问题，但是对于分层聚类，它似乎是对我的相似性矩阵做了一个距离矩阵(如果有变化，我将使用包aheatmap )，然后进行聚类。什么是最好的方法来指定它已经是一个基于数据的相似矩阵和聚类，就在热图的旁边？谢谢!

浏览 1提问于2018-04-06得票数 1

回答已采纳

3回答

python中基于基因表达矩阵的层次聚类

python、numpy、machine-learning、matplotlib、scipy

我如何在Python中进行分层聚类(在本例中是针对基因表达数据)，以显示基因表达值矩阵和树状图？我的意思是像下面这样的例子：在项目符号6(图1)之后显示，其中树状图绘制在基因表达矩阵的左侧，其中行已重新排序以反映聚类。如何在Python中使用numpy/scipy或其他工具执行此操作？另外，用欧几里德距离作为度量，用大约11,000个基因的矩阵来做这件事，在计算上可行吗？编辑:很多人建议使用聚类包，但我仍然不确定如何绘制上面在Python中链接的图像。例如，我如何使用Matplotlib将树状图覆盖在热图矩阵旁边？谢谢。

浏览 0提问于2010-06-05得票数 3

1回答

绘制每个k-means集群的热图？

r、cluster-analysis、heatmap、k-means

我有一个由数字观测组成的大型数据集。对于这个数据集，我计算了k-means，并为其定义了6个聚类。如何绘制每个集群的热图？当我尝试以下操作时，我得到一个错误： clusters <- kmeans(dataset, 6) heatmap(clusters$cluster)

浏览 45提问于2019-01-16得票数 1

2回答

使用python聚类/查找类似的热图

python、image-processing、machine-learning、computer-vision、k-means

我有以下热图的示例图像(我现在有数百个这样的images...for，以后会增长)：用我的人眼，我会说heatmap1，3和4是相似的，或者3和4是最相似的，我不确定。我希望能够根据模式和强度将最相似的热图图划分成不同的组。例如，中的每个heatmap包含24行和5列(行表示时间，列表示功能)。每列中的每一种颜色代表一个介于0到1之间的数字。与其他热图相比，第1列中用于heatmap 3和4的模式和强度更相似。但是，我不想看每一列，而是要比较每个热图的总体模式和强度。我以为我要用kmeans集群，但是找不到任何能帮助我实现我想要的东西的信息。据我

浏览 10提问于2017-05-11得票数 0

1回答

使用R和聚类绘制热图

r、ggplot2、heatmap、pheatmap

大家好，我正在尝试绘制热图想要的聚类图和图看起来不太好想要更改颜色我是新手可以告诉我如何绘制具有聚类值的热图吗?聚类值显示相似的模式聚类在一起我的数据我所尝试的只是尝试记录、归一化数据并绘制图形 library(ggplot2) library(reshape2) mydata=read.table("Test_data", sep="\t", header=TRUE) melted_cormat <- melt(mydata) head(melted_cormat) melted_cormat$new=log2(1+melted_cormat$val

浏览 8提问于2020-11-19得票数 0

3回答

聚类热图(带树状图)/Python

python、plotly、heatmap、plotly-python、dendrogram

我正试图用Python巧妙地创建一个集群热图(带有树状图)。他们在他们的网站上做的不是很好的扩展，我已经找到了各种各样的解决方案，但大多数是在R或JavaScript。我正在尝试创建一个热图，其中只包含来自热图左侧的树状图，显示跨y轴的集群(从分层聚类)。一个非常好看的例子就是这个例子：。我的目的是创建这样的东西，但只有左边的树状图。如果有人能用Python实现这样的东西，我会非常感激的！让数据是X = np.random.randint(0, 10, size=(120, 10))

浏览 15提问于2021-03-09得票数 3

回答已采纳

1回答

二进制R热图仍显示梯度

r、heatmap

我试图在R中绘制二进制数据矩阵(11x ~1500)的热图。 heatmap(y, col = hmcols); 矩阵'y‘看起来是这样的 [,1] [,2] [,3] [,4] [,5] [,6] [,7] [,8] [,9] [,10] [,11] [,12] [,13] [1,] 0 0 0 0 1 1 1 1 1 1 1 1 1 [2,] 0 0 1 0 0 1 0 0 0 0 0 0 1 [3,] 0

浏览 3提问于2013-09-13得票数 9

回答已采纳

1回答

如何避免dendograms上的文本和组数的限制

r、plot、hierarchical-clustering

我正在处理一个有20.000个变量的数据集。这些变量是用相同的单位度量来测量的，但是由于它是一个很大的数目，所以我决定对这些变量进行聚类，以获得一组相关的变量。我决定了一个很好的选择是应用分层聚类，我使用了以下代码(假设D是数据框架)： d <- dist(D, method = "euclidean") clust1 <- hclust(d, method="ward.D") plot(clust1) groups <- cutree(fit, k=150) 我得到的树状图如下：正如你所看到的，变量的名字使得在这里很难看到有用

浏览 0提问于2016-06-02得票数 2

回答已采纳

1回答

在R中绘制数据聚类后的热图

r、heatmap、hierarchical-clustering

我试图在聚类之后创建一个矩阵的热图。 heatmap(r.matrix, distfun = dist(r.matrix, method="euclidean"), hclustfun = hclust(dist(r.matrix, method="euclidean"), method ="ward")) 我在heatmap的帮助消息之后使用了上面的命令，但是返回了以下错误消息： Error in heatmap(r.matrix, distfun = dist(r.matrix, method = "

浏览 0提问于2013-11-13得票数 3

回答已采纳

2回答

如何在距离矩阵热图上绘制树状图

matlab

如果我有一个距离矩阵，比如说，函数pdist。现在，我想绘制这个距离矩阵的热图，并重新排序它的行和标签，这样就可以在热图的顶部/它的一侧显示距离矩阵的层次结构/聚类。注意:我没有使用clustergram()来对原始数据进行聚类。这里我只有距离矩阵。 Matlab树状图()函数只绘制一棵树，而heatmap函数只绘制一个热图。有什么想法吗？

浏览 1提问于2017-05-30得票数 0

回答已采纳

2回答

如何使R渲染图更快

r、render、time-complexity、shiny、heatmap

我们正在使用R来吐出在一个闪亮的应用程序(网页)上呈现的地块(热图)。目前，我们面临的问题是R绘制一个图所需的时间，以及计算所需的时间。让我通过一个人为的例子来说明这一点。在这个基本的测试用例中，R用~17秒作为png呈现和保存一个热图文件(取出数据计算机时间:行和cols集群是预先计算的)。我想知道是否有一个方法可以减少花费的时间，使这种情节类型的一个重要因素。也许我在其他常量计算中缺失了，它也可以从热映射函数中取出来。谢谢! 生成数据 m1 <- matrix(rnorm(500000,mean=15,sd=4),ncol=100) m2 <- matrix(rnorm(5

浏览 2提问于2013-11-22得票数 16

3回答

理解R中的热图树状图聚类

r、cluster-analysis、heatmap

我希望任何关于R的热图功能的dendogram (Colv，Rowv)的信息资料。例如聚类是如何工作的(这是欧几里得距离吗？)你不必发表冗长的解释，我已经对一些关键词感到高兴，这些关键词可以让我走上正确的轨道，这样我就可以做一些在线研究了。这是帮助手册的一段摘录，让我有点困惑。在这种情况下，“尊敬”意味着什么?它与重新排序有什么不同？如果Rowv或Colv是树状图，则它们将得到尊重(而不是重新排序)。

浏览 5提问于2013-03-13得票数 2

回答已采纳

2回答

clusters=6 -c-means-设置初始聚类数量，但仅生成4个聚类标签

python、machine-learning、cluster-analysis、fuzzy-c-means

我使用集群实现，我希望数据X形成我在算法中定义的集群数量(我相信这就是它的工作方式)。但这种行为令人困惑。 cm = FCM(n_clusters=6) cm.fit(X) 此代码生成一个带有4个标签的图- 0,2,4,6 cm = FCM(n_clusters=4) cm.fit(X) 此代码生成一个带有4个标签的图- 0,1,2,3 当我初始化簇号时，我期望标签0,1,2,3,4,5为6。代码： from fcmeans import FCM from matplotlib import pyplot as plt from seaborn import scatterplot as s

浏览 1提问于2019-07-16得票数 0

1回答

包含K簇和RowName注释的热图

r、heatmap

我有一个数据框架，看起来像这样，有一个基因名称，一个基因家族和Log2Fold的变化。我可以将折叠变化放在热图中，但希望只用基因家族注释行(在热图的右侧)，同时在整个热图上进行K均值聚类(生成5个聚类)。这在ComplexHeatmap中是可能的吗？我已经附加了我的数据帧： tf.logs Name 0dpi 1dpi 7di 14dpi 22dpi Gene1 MYB 1 2 3 4 5 Gene2 WRKY 4 3 6 5 11 Gene3 ERF 3 4 5 66 2 Gene4 bZIP 3 4 5 6 6 Gene5 EFR 4 4 4 4 4 我的热图代码如下：

浏览 22提问于2020-09-25得票数 1

1回答

R中的集群和热图

r、cluster-analysis、heatmap

我是R的新手，我正在尝试对数据表进行一些聚类，其中行表示单个对象，列表示为这些对象测量的特征。我已经完成了一些聚类教程，我确实得到了一些输出，然而，我在聚类后得到的热图与使用另一个程序从相同的数据表中生成的热图完全不对应。虽然该程序的热图确实显示了对象之间标记表达的明显差异，但我的热图没有显示太多差异，并且我无法识别热图上的任何聚类(即颜色)模式，它看起来只是一组彼此接近的随机杂乱的颜色(没有大的对比度)。这是我使用的代码的一个例子，也许有人知道我可能做错了什么。 mydata <- read.table("mydata.csv") datamat <- as.ma

浏览 1提问于2012-03-22得票数 4

回答已采纳

1回答

如何使用传单地图创建带有数字的热图？

javascript、d3.js、leaflet、heatmap、leaflet.draw

我希望创建如下所示的热图，在不同的缩放级别上对数字进行更改--该数字可以出现在鼠标悬停窗口中，而不是直接显示在地图上： http://www.trulia.com/local/san-francisco-ca/tiles:1|points:1_crime 知道怎么用传单地图做这个吗？编辑：我试过heatmap.js。但它不能在地图上显示数字。 EDIT2：我有一个csv文件，其中有三列： lat lng count 任何如何轻松地为加载它的技巧

浏览 4提问于2016-03-23得票数 1

回答已采纳

1回答

如何解释图片中热图中的分层聚类？

clustering

我试图解释热图，它是基于聚集的分层聚类创建的。我不知道热图到底是做什么的，考虑到我在左手边看到了症状的聚类，在热图的顶部，我得到了下面标签的聚类。有人能帮忙吗？这是这张照片 📷 此外，这是我用来生成热图的代码： library(pheatmap) pheatmap(t(dt_wd[-1]), cluster_rows = TRUE, cluster_cols = TRUE, clustering_distance_cols = "euclidean", clustering_distance_rows = "euclidean", clust

浏览 0提问于2020-09-07得票数 1

回答已采纳

1回答

基于预计算距离相关矩阵的海流聚类图问题

python、seaborn、heatmap、correlation、hierarchical-clustering

我是： (A)运行Seaborn文档( )中的示例，但使用dcor 中的，而不是仅限于线性或秩系数的pandas.DataFrame.corr。那么我想： (B)对我自己的数据使用几个DataFrames进行同样的操作。我直接向sns.clustermap提供距离相关性，就像在文档示例中所做的那样，因为我对热图中的结构感兴趣，而不是使用距离相关矩阵来计算链接，例如，在中这样做。我通过修改这个的代码来创建距离相关矩阵。 (A)这里没有问题当我执行时： distcorr = lambda column1, column2: dcor.distance_c

浏览 1提问于2019-09-12得票数 2

1回答

基于皮尔逊距离的微阵列数据热图

r、heatmap、dendrogram

我一直在尝试在R中为一些微阵列数据生成热图，并在很大程度上基于在线指令成功地生成了一个热图，但它并不完全符合我的要求。我想要的是基于皮尔逊距离而不是欧几里德距离对数据进行聚类，但我遇到了一些困难。使用heatmap2 (来自gplots包)，我使用以下代码来制作我的初始热图： heatmap.2(Test402,trace="none",density="none",scale="row", ColSideColors=c("red","blue") [data.test.factors],col=redgr

浏览 2提问于2011-07-17得票数 3

回答已采纳

2回答

在聚类中预测

r、cluster-analysis

在R语言中，有没有像我们在分类中那样的聚类预测功能？除了比较两个集群之外，我们可以从R得到的聚类图结果中得出什么结论？

浏览 2提问于2011-11-13得票数 2

1回答

比较图之间的相似性？

cluster-analysis、similarity、directed-graph

我有多个，表示为有向图。我已经使用来比较两个概念图，但是现在我想将相似的图分类/聚类在一起。 AFAIK，传统的聚类算法以输入为多维数据点.但我也读到，很难，而且不建议将一个图转换成一个向量。在这种情况下，我如何处理这个问题？

浏览 3提问于2016-06-14得票数 0

1回答

从R中的PCA坐标创建热图

r、matrix、heatmap、text-mining、pca

我想在一个变量上创建一个针对其自身的热图。但是，我没有矩阵格式。我有每个项目的PCA1和PCA2坐标，我想知道如何在此基础上创建热图。这是我的数据的样子(其中cluster是k-means聚类分类) ID PCA1 PCA2 cluster echocardiography -0.88 0.87 9 infarction -0.18 0.57 7 carotid 1.1

浏览 13提问于2017-06-24得票数 0

回答已采纳

2回答

无插补的热图NA值相异矩阵的聚类

r、heatmap、hclust

我正在尝试制作一个不同矩阵的热图，这个矩阵有很多个NAs。然而，我在尝试执行集群时遇到了问题。在没有集群的情况下，热图工作良好。我不想归罪/删除NAs。有没有执行集群的方法？我知道使用NAs计算距离是一个问题，但应该有一种方法来解决它，对吧？我得到以下错误消息： “hclust中出错(get_dist(submat，distance)，method = method)：外部函数调用中的NA/NaN/Inf (参数10) 此外:警告消息: NA存在于矩阵中，通过移除NA值来计算距离。“ 编辑：我使用的数据是一个包含大量NAs的不同寻常的矩阵。也许这就是问题所在？但我也想在热图中可视化这些NA

浏览 47提问于2021-06-09得票数 0

回答已采纳

1回答

共识聚类:如何根据共识矩阵选择最终的聚类？

machine-learning、clustering

我一直在阅读这文章中关于协商一致聚类和协商一致矩阵的内容。我理解在对数据的某些部分进行重新采样和聚类H次之后，如何建立共识矩阵。我了解到，协商一致矩阵用于确定簇(k)的最佳数量，并允许生成一个很好的热图。我不明白的是，这个协商一致的矩阵是如何导致最终的聚类的。假设我有一个协商一致矩阵4*4 (因此我们有4项要聚类)，其中矩阵中0到1之间的每个值表示将项目i和j分配到同一个集群的次数，除以两个项被选择进行聚类的总次数。经过4次迭代80%的子样本(取自这里)，我们可以得到以下的一致性矩阵。我们跟踪了在获得这一协商一致矩阵的过程中形成的所有4组。我们如何根据这个共识矩阵选择最终的聚类？ 📷

浏览 0提问于2021-02-26得票数 0

2回答

如何对包含文本数据的图形组件进行聚类？

nlp、clustering、unsupervised-learning、graphs、graph-neural-network

假设我有一个图，它有像下面的图像这样的组件。 📷 图节点包含文本数据(标题)，边缘数据是相似度(百分比)。我知道每个组件代表一个集群，但我的问题是如何集群这些组件。示例：图组件可以为它们的节点(标题)提供这些数据。如何制作比萨饼如何制作意大利辣香肠比萨饼烹饪比萨饼的食谱意大利比萨饼所需的原料我还有另外一个带有这些标题的图形组件。烤肉店自制Kebab 烤肉串是怎么煮的？我知道，上面提到的这两个图组件是单独的集群。我的问题是如何将这两个图形组件聚在一起，因为它们可能都有相同的主题(烹饪、食物等)。我研究过或认为可以解决问题的方法：有一个名为BERTopic的库，

浏览 0提问于2022-11-09得票数 1

2回答

如何在seaborn clustermap中将Y ticklabels标记为group/category？

python、matplotlib、plot、graph、seaborn

我想为患者的基因存在/缺失数据制作一个聚类图/热图，其中基因将被分类(例如趋化性、内毒素等)并进行适当的标记。我在seaborn文档中没有找到任何这样的选项。我知道如何生成热图，但我不知道如何将ytick标记为类别。以下是我想要实现的目标的示例(与我的工作无关)：在这里，yticklabel一月、二月和三月被赋予组标签冬季，其他yticklabel也被类似地标记。

浏览 14提问于2019-11-14得票数 12

回答已采纳

1回答

按类别标签对数据点进行分类的热图

r、ggplot2、classification、heatmap

我有一个数据帧，其中列用于不同的属性，列用于类标签。我正在尝试创建所有属性的热图/矩阵图，其中数据点按其类别标签进行分类。如果我将数据帧转换为数字矩阵，则可以使用热图函数来创建热图： q3 <- read.arff("diabetes.arff") q3_m <- as.matrix(q3[,1:8]) heatmap(q3_m, Colv=NA, Rowv=NA) 但是，我不知道如何通过类变量对它们进行排序，因为我必须将它从矩阵中删除，因为它不是数字。如果我将数据转换为长格式，我还可以使用ggplot制作以下热图： q3_long <- p

浏览 17提问于2021-03-09得票数 0

1回答

Pheatmap:在树状图中重新排序树叶

r、pheatmap

我已经创建了一个热图，其中包含基于层次聚类的相应树状图，使用 pheatmap 包。现在，我想要更改树状图中树叶的顺序。最好使用最佳叶子方法。我到处寻找，但没有找到任何关于如何改变实现这一点的解决方案。我非常感谢关于如何使用最优叶子方法改变叶子顺序的建议。下面是我的随机数据示例代码： mat <- matrix(rgamma(1000, shape = 1) * 5, ncol = 50) p <- pheatmap(mat, clustering_distance_cols = "manhattan", cluste

浏览 71提问于2019-02-19得票数 3

回答已采纳

1回答

以一致性矩阵为相似矩阵的层次聚类

machine-learning、clustering、similarity

我正在关注关于programming中的共识集群的这文章。在第7页中，作者指出：“协商一致矩阵很自然地被用作可视化工具，以帮助评估集群的组成和数量。特别是，如果我们将颜色梯度与0-1的实数范围相关联，使白色对应于0，而暗红色对应于1，如果我们假定矩阵的排列使属于同一集群的项目彼此相邻(使用相同的项目顺序来索引矩阵的行和列)，那么对应于完美一致性的矩阵将在白色背景上显示为以红色块沿对角线描述的颜色编码热图。 📷 一致性矩阵本身是一个(N×N)矩阵，它存储每对项目的聚类比例，其中两个项目聚在一起。通过取每个扰动数据集连通性矩阵的平均值，得到一致性矩阵。为了从一致矩阵到可视化，作者指出：“我们可以利

浏览 0提问于2021-02-27得票数 1

1回答

R:有没有一种方法可以只生成相异矩阵的热图并按聚类排序？

r、heatmap、categorical-data

我正在使用hclust在266个观察值中寻找集群。所有的变量都是绝对的。我正在尝试创建从daisy函数创建的相异矩阵的热图，以可视化集群内的相似性。我正在使用heatmap函数： heatmap(x, Rowv = NULL, Colv = if(symm)"Rowv" else NULL, distfun = dist, hclustfun = hclust, reorderfun = function(d, w) reorder(d, w), add.expr, symm = FALSE, revC = identical(C

浏览 2提问于2019-09-09得票数 0

2回答

R使用热图绘制kmeans聚类

r、visualization、cluster-analysis、k-means、heatmap

我想用kmeans聚类一个矩阵，并能够将其绘制为热图。这听起来很微不足道，我见过很多这样的情节。我试着用谷歌搜索一下，但找不到绕过它的方法。我希望能够在这张图上画出像A或B这样的面板。假设我有一个250行5列的矩阵。我不想聚集列，只聚集行。 m = matrix(rnorm(25), 250, 5) km = kmeans(m, 10) 那么我如何将这10个集群绘制为热图呢？你的评论和帮助是非常受欢迎的。谢谢。

浏览 3提问于2011-02-23得票数 5

回答已采纳

2回答

Python -使用K-均值进行聚类。一些零方差列

python、cluster-analysis、bioinformatics、k-means、variance

我有一个由200~ 99x20个频率阵列组成的数据集，每一列的总和都是一致的。我用热图绘制了这些图。每个数组都很稀疏，每99个位置只有1-7/20的值是非零的。然而，我想根据它们的频率分布(最小欧几里得距离或类似的东西)来聚类这些样本。我已经将每个99x20阵列排列成一个1980x1阵列，并将它们聚合到一个200x1980观测阵列中。在找到集群之前，我已经尝试过使用scipy.cluster.vq.whiten来美白数据。whiten通过其方差对每一列进行规范化，但由于我将数据数组扁平化的方式，我有一些(8)列的所有零频率，因此方差为零。因此，白化数组具有无穷大的值，并且质心查找失败(

浏览 2提问于2013-03-21得票数 4

2回答

尺寸限制吗？

r、cluster-analysis、data-mining、hclust

我对R不熟悉，我正试着在大约50K的物品上运行hclust()。我有10列要比较，50K行数据。当我尝试分配距离矩阵时，我得到：“不能分配5GB的向量”。这个有尺寸限制吗？如果是这样的话，我该如何做一个这么大的集群呢？编辑最后，我增加了max.limit，并将机器的内存增加到了8GB，这似乎已经修复了它。

浏览 7提问于2012-10-25得票数 2

1回答

K表示簇间和簇内排序

我想知道其他人对K-means聚类排序做了什么。我正在制作热图(主要是数据)，并使用自定义热图函数(基于R的内置热图函数)获得漂亮的图形。然而，我想要两个改进。第一种是根据递减的平均值对我的集群进行排序。例如，以下代码： fit = kmeans(data, 8, iter.max=50, nstart=10) d = data.frame(data, symbol) d = data.frame(d, fit$cluster) d = d[order(d$fit.cluster),] 给我一个在集群列上排序的data.frame。什么是对行进行排序的最佳方法，以便8个集群按其各自的均值排序？

浏览 1提问于2011-01-25得票数 5

回答已采纳

1回答

簇、热图和R从簇中获取信息

r、cluster-analysis、heatmap

我最近开始使用R来对我的数据进行聚类。我的目的是有一个热图与相关的树状图，并在热图上的聚类的方块识别。到目前为止，我尝试了来自hclust包的gplots，我可以用下面的代码在树状图上绘制矩形： a <-read.table ("test.txt", header = TRUE) b <- as.dist(a) dend <- hclust(b, method = "complete") plot(dend) groups <- cutree(dend, k=3) rect.hclust(dend, k=3, border = "

浏览 6提问于2015-01-20得票数 0

回答已采纳

1回答

在部分Dataframe上使用PCA

dataframe、machine-learning、artificial-intelligence、pca

我想使用一种聚类算法来实现包含许多特性(32列)的数据帧。部分特征使用一个热编码器进行编码。我希望使用主成分分析( PCA )来减少维数，使机器学习过程更容易。是否可以仅对数据帧的某些列使用PCA，而保留其他列，然后使用机器学习模型。或者，在聚类之前，必须对所有数据使用PCA。

浏览 3提问于2022-07-04得票数 -1

回答已采纳

1回答

Pheatmap:对完整矩阵进行分层聚类，但只显示行的子集

r、pheatmap

我有一个基因表达数据集，并想显示一个热图的，一些的基因。首先，我想对所有的基因进行分层聚类，然后创建一个树状图，然后在这些基因的子集上创建一个热图。显式地说，heatmap将具有与已经创建的树状图相同的列，但显示的行较少。我试着使用下面的代码，但是它似乎是基于缩减矩阵对集群进行重新排序。 # Random data full_mat <- matrix(rgamma(1000, shape = 1) * 5, ncol = 50) reduced_mat <- full_mat[1:5,] # Function to calculate distances on full-ma

浏览 2提问于2019-02-20得票数 0

3回答

为什么Kruskal聚类生成次优类？

algorithm、tree、cluster-analysis、minimum-spanning-tree、kruskals-algorithm

我试图开发一种聚类算法，任务是在一组2D点上查找k类，(以k作为输入)，使用Kruskal算法进行轻微修改，找出k个生成树，而不是一个。我用rand指数将我的输出与提议的最优(1)进行了比较，当k=7时，结果是95.5%。比较可以在下面的链接中看到。问题：集合中有5个清晰的聚类，它们很容易被算法分类，但是当k> 5时，结果是相当令人失望的，这是事情开始变得棘手的时候。我相信我的算法是正确的，也许数据对Kruskal方法特别不好。单链接聚类，如Kruskal，在某些问题上表现不佳，因为它将对聚类质量的评估降低到一对点之间的单一相似性。该算法的思想非常简单：用数据集制作一个完整

浏览 2提问于2013-12-05得票数 6

回答已采纳

2回答

生成点毫微子的热图层

javascript、php、google-maps、heatmap、google-fusion-tables

我正在使用Google的热图层来显示热图，但是，我现在有太多的点，它停止工作了，因为浏览器不能再处理它了。我发现它们提供了融合表，但它们也是有限的:100 K行，这太低了。我需要绘制毫安或甚至更多点的热图。如果我的服务器能够有一些PHP脚本来呈现热图(例如，每天一次)，我将是完美的。然后来自js的客户端就会下载一个预装好的热图(就像谷歌地图一样，但也可能是不同的地图)。用一些现有的技术(可以是商业化的)，这是可能的吗？

浏览 1提问于2018-05-15得票数 13

回答已采纳

6回答

如何制作一个包含大矩阵的热图？

r、heatmap

我有一个1000*1000的矩阵(它只包括整数0和1)，但当我试图制作一个热图时，因为它太大而出错。如何使用如此大的矩阵创建热图？

浏览 1提问于2011-04-15得票数 16

1回答

ComplexHeatmap包中切片的顺序

r、bioconductor

我在R中使用ComplexHeatmap包，并按k均值聚类(行和列)拆分我的热图。行的聚类效果很好。对于列，我得到了一个4列集群(对照)和一个8列集群(处理)，这是很好的。但是，对于某些热图，控件幻灯片位于右侧，而对于某些热图，控件幻灯片位于左侧。我想统一排序(控制向左，处理向右)。当我使用column_split函数重新排列切片时，我得到了3个簇，而不是2个簇。我如何解决这个问题？提前谢谢你。 Heatmap(mat, name = "mat", border=TRUE, rect_gp =gpar(col="white", lwd=1), column_km

浏览 29提问于2020-03-10得票数 0

1回答

在Python编程中使用numpy和nltk或CLUTO对单词进行聚类

python、cluster-analysis、nltk、cluto

我正在尝试对一些单词进行聚类。我的部分数据如下所示(这只是个例子)。 cat dog horse ostrich cat 8 2.3 3.4 4.7 dog 7 8 3 2.4 horse 3.4 2.5 8 1.5 ostrich 3.4 3.2 4.4 8 数字越大，表示两个单词之间的相似度越高。基于这种格式的数据，我想做一个聚类(例如，(猫，狗)，(马)，(驼鸟)共3个聚类)。一开始，我试着用CLUTO...制作一些簇和一个(非常漂亮的)图，如下所示。但是我不能..。我已经看过手册了，但它并不那么容易理解。因此，我尝试使用nltk中的一些

浏览 3提问于2013-12-26得票数 1