R中的聚类条形图_r软件中的聚类_使用R的聚类算法 - 腾讯云开发者社区

、、、、

我正在尝试在我闪亮的应用程序中构建交互式图形。用户应该能够单击条形图并查看案例在另一个图形中的显示位置，例如条形图旁边的散点图。有不同的r包，它们做得很好: iplot，rggobi，acinonyx。我也找到了qtlcharts，但它并不完全是我想要的。问题是，我不知道如何将不同的iplots集成到我闪亮的应用程序框中。有没有办法防止iplots为图形打开单独的窗口？在acinonyx中，您可以使用window=FALSE，这将阻止打开图形的java窗口。但是图表也不会显示在框中。您可以将iplot添加/移动到icontainer、iVisual或iWindow中，但它们都不能集成到ui

浏览 2提问于2016-01-15得票数 1

1回答

带有python和pandas的SPSS风格的多列计数“聚类”条形图

、、

我有一些分类数据 example_data = {'Role':['Teacher', 'Teacher', 'Student', 'Admin', 'Student'], 'Preference': ['Online', 'Blended', 'Blended', 'Face-to-face', 'Face-to-face'], 'Location' : ['C

浏览 8提问于2021-05-07得票数 0

回答已采纳

2回答

在聚类中预测

、

在R语言中，有没有像我们在分类中那样的聚类预测功能？除了比较两个集群之外，我们可以从R得到的聚类图结果中得出什么结论？

浏览 2提问于2011-11-13得票数 2

2回答

你使用什么方法来选择k-means和EM中的最佳聚类数？

、、、

有许多聚类算法可用。一种流行的算法是K-means算法，其中，基于给定数量的聚类，该算法迭代以找到对象的最佳聚类。在k-means聚类中，您使用什么方法来确定数据中的聚类数？ R中是否有可用的包包含用于确定正确的集群数量的V-fold cross-validation方法？另一种常用的方法是期望最大化(EM)算法，该算法为每个实例分配一个概率分布，该分布表示该实例属于每个集群的概率。这个算法是在R中实现的吗？如果是，它是否具有通过交叉验证自动选择最佳聚类数量的选项？您是否更喜欢其他的聚类方法？

浏览 1提问于2010-02-23得票数 13

2回答

基于R的K-中心聚类

、、、

我找不到一个简单的库函数用于使用R进行k中心聚类，而我可以找到用于k均值(kmeans())和层次聚类(hclust())的库函数。是否有像中描述的那样使用R进行简单贪婪k中心聚类的库函数如果没有-因为我是R的新手-人们将如何实现它(我理解其中的逻辑-只是不知道如何用R代码实际编写它)。

浏览 1提问于2012-10-08得票数 4

回答已采纳

1回答

SSRS标书聚类堆叠条形图

、、

有没有办法在投标中创建一个图表，将这些图表的属性结合起来像这样的水平堆叠条形图：和一个像这样的水平条形图：要创建堆叠和聚类/分组的图表？

浏览 2提问于2012-09-27得票数 0

回答已采纳

1回答

为什么聚类系数与我的程序和library的库不同？

、、

我只是用C++编写了一个程序，它以点格式计算无向图的聚类系数。我的问题是，我的程序的结果与R的输出不匹配(使用igraph库)：我的节目： The cluster coefficient of "0" is: 0.257 (88/342) The cluster coefficient of "1" is: 0.444 (40/90) The cluster coefficient of "10" is: 1.000 (2/2) The cluster coefficient of "2" is: 0.418 (46/11

浏览 1提问于2011-07-07得票数 2

回答已采纳

1回答

PBI指数

、

为什么在Power报告中我得到了thoose数字，以及表中存在的零值？没有加成，只有Sum() 聚类条形图

浏览 2提问于2020-05-05得票数 1

回答已采纳

3回答

R中丢失类别和数值的聚类算法

、、、

我想在R中缺少分类和数值的数据集上执行营销细分聚类。由于缺少值，我无法执行k-means聚类。 R版本3.1.0 (2014-04-10) 平台: x86_64-apple-darwin13.1.0 (64位) Mac OSX 10.9.3 4 4GB硬件驱动器在R中是否有一个聚类算法包可以适应部分填充速率？查看关于缺失值的学术文章，研究人员为特殊用例创建了一个新的算法，这些包在R中不可用。例如，具有软约束的k-means和具有部分距离策略的k-means聚类。我有36个变量，但下面是前5个变量的描述： head(df) user_id Age Gender Househo

浏览 1提问于2014-06-04得票数 9

1回答

对于层次聚类，如何在R中找到每个聚类中的“中心”

、、

我知道如何在K-means聚类中找到每个簇的中心。但对于层次聚类，我不确定如何在R中做到这一点。以下是我的代码:首先，我使用DTW距离生成距离矩阵，并将其输入到R中： DTW<-read.csv(file.choose(), head=T, row.names=1) DTWS2N <- as.dist(as(DTW, "matrix")) 然后，我做了分层聚类(K=10)： hc <- hclust(DTWS2N) plot(hc) groups <- cutree(hc, k=10) rect.hclust(hc, k=10, border="

浏览 1提问于2016-03-03得票数 0

2回答

Gnuplot直方图簇(条形图)，每个类别有一条线

、、

直方图聚类/条形图我正在尝试使用gnuplot从这个数据文件中生成以下直方图集群，其中每个类别每年在数据文件中的单独行中表示为： # datafile year category num_of_events 2011 "Category 1" 213 2011 "Category 2" 240 2011 "Category 3" 220 2012 "Category 1" 222 2012 "Category 2" 238 ... 但我

浏览 88提问于2013-08-20得票数 18

回答已采纳

1回答

Y轴标签聚类Matplotlib

、、

我不知道我在这里做错了什么，使y-tick标签聚集在一起。我尝试将标签设置为set_yticklabels中的值，然后在条形图中得到聚类结果。X轴的刻度和标签工作得很好，但是y轴就不行了。我想要实现的是y轴的刻度标签不聚类，希望有人能帮上忙。谢谢

浏览 0提问于2020-06-27得票数 0

1回答

如何将不同方法的集群标签与r中的实际标签匹配？

、、、、

基本上，我模拟了1000多个数据集，然后通过K均值、基于模型的聚类等不同的聚类技术对它们进行聚类。然后，利用分类正确率CCR验证了这些方法的性能。然而，我面临标签切换的问题，因此无法得到现实的CCR。那么，我的问题是，有没有一种方法来统一多元数据集r中的所有标签？下面是一个简单的例子： # Create the random data sets: data1 <- rnorm(5, 0, 0.5) # cluster 1 data2 <- rnorm(5, 2, 0.5) # cluster 2 data3 <- rnorm(5, 4, 0.5) #

浏览 1提问于2018-06-21得票数 0

回答已采纳

2回答

如何使echarts工具提示可滚动？

我正在使用echart库创建堆叠的聚类条形图。但是工具提示中的数据太多，因此我需要使工具提示可滚动。如何在echarts中做到这一点？

浏览 6提问于2018-08-01得票数 0

3回答

通过降低数据的准确性对大数据进行聚类？

、、

我有100万行，有20个属性要进行分层聚类。当我想用R中的dist()在这个数据上建立一个距离矩阵时，它说它需要5 TB内存。我有以下几种方法：通过抽样减少行数改变聚类方法？现在，你建议另一种方法吗？我有一个想法，我想如果我降低了值的准确性，然后做“分组”，那么我可以删除重复的行，并有一个新的列，每一行的重复计数。是否有任何R包可以对这些数据进行分层聚类？ "group by"：计数重复的行数，并添加一个列，说明此行在源中被复制了多少次。

浏览 0提问于2016-08-30得票数 2

1回答

R中聚类的训练与测试评价

、、

我正在尝试实现类似于R中的@bens 的东西，我正在处理非结构化的新闻文章，并希望在进行主题建模之后对它们进行聚类，我尝试执行@ben提供的代码，它成功了。我想知道如何对训练中的数据进行分类，并测试和预测测试数据的聚类，然后评估测试数据是如何聚类的，是否使用平均精度。我知道这变成了半无监督，而不是无人监督，但我想试一试，看看结果。

浏览 0提问于2016-08-13得票数 0

回答已采纳

1回答

KMeans聚类:将结果添加到初始数据集

、、、

我在KMeans的帮助下定义了集群的特性： x = df_1.iloc[:, np.r_[9:12,26:78]] 并运行代码以获得6个集群： kmeans = KMeans(n_clusters = 6) kmeans.fit(x) 现在，我希望在我的初始数据集中有一个编号为(df_1("new") =.)的列:1用于集群1中的数据组，2用于集群2中的数据组，等等。我该怎么做呢？谢谢!

浏览 2提问于2021-06-19得票数 0

回答已采纳

1回答

R和Matlab结构

、、、

我对R知之甚少，但我需要将matlab中的层次聚类所产生的树状图转换为R树状图结构。下表显示了matlab函数中分层聚类产生的树状图；其中第一列和第二列是对象或分支的is，第三列是距离。有没有办法把这个表(或matlab的树状图)映射成R树状图？

浏览 1提问于2016-01-18得票数 0

回答已采纳

2回答

Matplotlib -来自字典的聚集条形图，每个键具有多个值

、

给定dict.items()如下所示： ('a', [11, 10]) ('b', [10, 11]) ('c', [7, 6]) ('d', [5, 5]) ('e', [21]) 首先，我如何将第二个值附加到'e‘，使其长度与其他值相匹配？其次，忽略e的长度问题，如何使用标签的键制作值的聚类条形图。看起来我想把这些值分成列表和图 ax.bar(len(d.keys()), list1, width='0.5', color='r') ax.bar(len(d.keys

浏览 35提问于2017-08-06得票数 0

1回答

按圆心和半径对圆的数据进行聚类

、、、、

我有一个圆的数据集，圆心(x，y)和半径(R)。需要对位置接近的圆进行聚类。然后我有一个点需要找到最近的集群。 index x y r 0 0 0 3 1 1 2 2 2 9 5 1 3 10 6 1 4 100 8 20 例如，通过索引，集群将是(0,1)，(2,3)，(4)。我认为这部分应该通过聚类算法来开发，但不知道是哪种算法。对于下一步-找到最近的聚类，考虑到时间复杂性，找到它的最佳方法是什么？

浏览 0提问于2021-01-08得票数 0

1回答

.rect_dendrogram中的错误(dend，k= k，palette = rect_border，rect_fill = rect_fill，：k必须介于2到97之间)

、、、、

我试图估计一个聚类树状图在R中的结构主题模型，我产生了98个主题。我首先运行了以下程序，运行得很好： res.hc <- eclust(scale(out_corr$cor), "hclust", nboot = 500) 然后，我尝试使用以下语法来可视化树状图： fviz_dend(res.hc, rect = TRUE) 在这里，我收到了以下错误：.rect_dendrogram中的错误(dend，k= k，palette = rect_border，rect_fill = rect_fill，：k必须介于2到97之间) 这是因为我的模型中的主题数是98吗？如果是这

浏览 8提问于2022-04-01得票数 0

回答已采纳

4回答

基于Levenshtein距离的文本聚类

、、、、

我有一组(2k - 4k)的小字符串(3-6个字符)，我想对它们进行集群。由于我使用字符串，以前在上的答案告诉我，很适合用作字符串的距离函数。而且，由于我事先不知道集群的数量，所以是要走的路，而不是k-方法。虽然我得到了抽象形式的问题，但我不知道如何才能真正做到这一点。例如，MATLAB或R是使用自定义函数(Levenshtein距离)实现分层聚类的更好的选择。对于这两个软件，都可以很容易地找到Levenshtein远程实现。聚类部分似乎更难。例如，计算所有字符串的距离数组，但我无法理解如何使用距离数组实际获得集群。你们中的任何一位专家能告诉我如何用自定义函数在MATLAB或R中实现分层聚类

浏览 4提问于2014-02-02得票数 37

回答已采纳

1回答

用R对SOM进行聚类

如何在不识别簇数的情况下，使用R中的SOM(自组织映射)方法进行聚类？我在R中使用了“Kohonen”包，但它迫使您通过somgrid()设置集群的数量。

浏览 4提问于2016-11-05得票数 0

1回答

如何在hdbscan聚类后重建图像？

、、、

我正在尝试使用hdbscan聚类后重建脑瘤图像。但是，hdbscan与kmeans不同，它没有集群中心，因此我对如何获得集群映像感到有点困惑。我尝试通过将(65536,3)数组与hdbscan标签(即r)进行匹配，并在获得crs中每个集群的平均聚类点后存储它们，从而获得ref集群中心。我不确定这是否是重建图像的最好方法，也就是基于聚类获得一些均值中心，然后使用均值中心加标签重建图像。 crs = np.zeros((dbnumber_of_clusters, 3)) for i in range(0, dbnumber_of_clusters): dbcluster_points

浏览 4提问于2019-08-13得票数 0

1回答

如何创建在x轴上有两个标称变量的聚类条形图？

、、

假设有三个名义变量，A，B和C。很容易生成一个包含其中两个的聚类条形图:一个，例如A，进入“X轴”，另一个进入“X上的集群”，例如Z。也有3-D版本，其中可以添加“Z轴”并使用第三个名义变量。但这些都很难读懂，因为有些栏目会隐藏在另一些栏目后面。有没有一种方法可以创建一个二维聚集条形图，它将两个名义变量分组在“X轴”上。所以，假设我想让变量A和B在“X轴”上。因此，我希望为A的每个值都有一个聚类条形图，每个B的值都是B。例如，假设A是性别(比如男性和女性)，B是眼睛颜色(比如棕色、绿色、蓝色)。那么我想要一个男性酒吧，所有的男性棕色眼睛，男性绿色眼睛，男性蓝色眼睛。在同一张图表中，紧挨着

浏览 1提问于2017-10-31得票数 0

1回答

如何评估k-均值聚类中的距离？

、

我尝试使用k-表示集群(使用SQLserver + R)，我想知道我们如何才能正确地估计距离。例如，如果我们考虑欧几里得距离构成星系团的中心，如果对于相同的数据集，不同大小的簇会发生什么？大星系团中的“正常”点的距离要高于小星团中的“离群点”。所以：它与每个簇的中心/尺度欧氏距离相关吗？(然后将离群值视为具有最大标度距离的离群值) 还有其他的距离需要考虑吗？

浏览 0提问于2016-04-28得票数 2

回答已采纳

1回答

我应该用什么聚类来把大学分成相似的比较组？

、、

我对聚类很陌生，不知道如何选择应用哪种聚类方法。我的数据是大约1303所大学和35个变量，如收到/接受的申请，学生综合SAT成绩，毕业rate...etc。这是和毕业率说，如果我想把大学分成类似的比较组，哪一组会更好呢？我尝试了一种完全的链接方法--r中的hclust，但是它的图只是底部的一片混乱. 有什么建议说我可以用我的数据集在r中做更好的聚类吗？谢谢！

浏览 1提问于2014-03-20得票数 0

回答已采纳

1回答

这个公式和纯度公式验证一样吗？

、

我阅读过的大多数论文都使用外部验证来验证聚类的准确性，并使用此公式：其中ai是在ith集群及其相应的真类中发生的数据对象的数量，n是数据集中的数据对象的数量。根据该度量，r值越高，聚类效果越好，最佳聚类值为r= 1.0。这个公式和纯度公式一样吗？你可以在这里读到纯度不管怎样，谢谢

浏览 1提问于2018-07-12得票数 0

回答已采纳

1回答

如何在空间中聚类采样较差的区域

、、、

我的数据集包括在大约150个港口采集的15000份鱼类市场样本。不幸的是，取样并不均匀，一些港口有1-10个样本，而另一些有1000个样本。我想把这些港口汇集在一起，以便实现以下两项目标：地理位置相近的港口聚集在一起最后的聚类都有大致相似的取样密度，例如1000个样本。第1项可以使用基于距离的标准聚类单独完成。但我怎样才能在这个基础上达到#2呢..？我应该看哪些工具/方法？(最好在R区)

浏览 0提问于2015-10-23得票数 0

1回答

聚类柱形图中的条件格式

、、、

我有一个包含2个数据集的聚类柱状图。一个是目标，另一个是价值。如果该值高于目标，则该条形图的颜色必须更改为红色，如果不是绿色的话。(请参阅所附屏幕截图)。在power BI中有什么方法可以做到这一点吗？感谢您的支持。 <code>B0</code>

浏览 12提问于2019-04-02得票数 2

1回答

相似度矩阵的聚类技术

、、

我有128个受访者的二进制数据，基于他们所选择的数码相机的功能。其中'1‘代表特征的选择，而'0’代表未选择的特征。我在列中有92个产品特性，在行中有响应者。每个响应者从92个特征集中恰好选择了20个特征。我想根据他们选择的功能创建不同用户组的集群。我在这些二进制数据上尝试了一些聚类算法，比如模糊聚类和层次聚类，但它没有给我任何好的结果，而且创建的聚类真的很糟糕。因此，现在我已经将骰子系数相似度矩阵应用于数据w.r.t响应者，这基本上给出了每个响应者与所有其他响应者的相似度得分。是否有可能在这个相似度矩阵上应用聚类技术来获得好的聚类？还有，我可以在这个用户相似度矩阵上应用哪些聚

浏览 5提问于2017-03-07得票数 0

1回答

在雪花中人工重新聚类的限制是什么？

假设我有一个表(使用，没有自动重新聚类)，这个表不是特别好的集群： create or replace table recluster_test3 ( id NUMBER ,value NUMBER ,value_str VARCHAR ) cluster by (value) ; alter table recluster_test3 suspend recluster; -- no automatic reclustering describe table recluster_test3; insert into recluster_test3 ( sel

浏览 5提问于2020-01-09得票数 1

1回答

R:在e1071包中有比libsvm更多的支持向量机实现吗？

、、

我试着比较R中SVMs的不同实现，在e1071包中还有比libsvm实现更多的实现吗？一般来说，除了libsvm实现nu-支持向量机和epsilon-支持向量机之外，是否有一个很好的替代方案？

浏览 2提问于2013-01-18得票数 3

3回答

R:聚类验证方法(混合数据)

、、

我使用两种聚类方法k-原型和PAM聚类混合数据集包含数值和分类特征()。我的问题是：如何验证聚类的结果？我在R中发现了不同的方法，如兰德索引、SSE、Purity、clValid、pvclust --所有这些方法都适用于数字数据。在混合数据的情况下有什么方法可以使用吗？

浏览 1提问于2018-03-14得票数 1

2回答

在R中执行基于向量的聚类的函数和数据格式

、、、、

我需要对数据行向量的相关性运行聚类，也就是说，我打算使用数据行之间变量向量之间的相关性，而不是使用单个变量作为聚类预测器变量。在R中是否有一个基于向量的聚类函数。如果不是这样，我需要手动完成，什么是正确的数据格式，以馈入一个函数，如cmeans或kmeans？假设我有m个变量和n个数据行，m个变量构成每个数据行的一个向量。所以我有一个n×n矩阵，用于相关或余弦。这个矩阵可以直接插入到聚类函数中，还是需要进行某些处理？非常感谢。

浏览 0提问于2012-03-07得票数 0

1回答

在R中对照片进行聚类？

、、

我这里有一个一般性的R问题：通常，使用数码相机时，我们倾向于点击大量图像，这可能是重复的，在Picassa上共享时可能会浪费在线空间，或者在尝试删除一些不想要的图像时是一种开销。是否可以使用R对照片进行聚类？我的意思是，在Matlab中有一些用于图像处理的聚类功能，但是这种功能在R中是否可用，或者是否有任何建议来这样做？请提供一些关于这个主题的想法。

浏览 0提问于2010-08-02得票数 8

回答已采纳

1回答

Python:单链接聚类算法

、

我是Python的新手，我正在寻找一个简单的单链接聚类python算法的例子，该算法基于创建一个邻近矩阵并从中删除节点。我知道有像numpy这样的包，但我宁愿避免它们。我在网上搜索过，但找不到任何简单到能够理解的代码，以便以后自己复制它。首先是具有L( 0 ) =0和序列号m=0的不相交聚类。根据d(r)，(s) = min d(i)，(j)找到当前集群中最相似的对，例如对(r)，(s)，其中最小值在当前集群中的所有簇对上。增加序列号: m =m+ 1.将集群(r)和(s)合并成一个集群，形成下一个集群m。更新邻近矩阵D，删除与集群(r)和(s)对应的行和列，并添加对应于新形成的集群

浏览 5提问于2014-03-13得票数 0

回答已采纳

1回答

我在R中得到了这些编程错误--试图应用非函数，将类“因子”添加到无效对象

、、、、

我是R编程的新手。我有一个csv文件，其中包含了国家，预期寿命和地区的项目。我要做以下几件事：列出来不。按地区划分的国家和绘制条形图绘制每个区域的方格图基于预期寿命的k-均值聚类国家说出那些有最低和最高预期寿命的国家。 input.csv Country,LifeExpectancy,Region India,60,Asia Srilanka,62,Asia Myanmar,61,Asia USA,65,America Canada,65,America UK,68,Europe Belgium,67,Europe Germany,69,Europe Switz

浏览 3提问于2014-04-09得票数 0

回答已采纳

1回答

聚类表示耗气量的多条曲线

从2010年到2014年，我有700个小时的汽油消耗时间序列。有一次，系列代表了一家公司的消费。一些人有恒定的消费，另一些人一年只消费4个月，还有一些人的消费波动性很高。因此，我想根据消耗曲线的形状对它们进行分类。我尝试了R包"kml"，但我没有很好的结果。我也尝试了"kmlShape“包，但似乎我有太多的数据，每次R退出.. 我想知道如果使用快速傅立叶变换，然后聚类，这可能是一个好主意？我的目标是真正区分消费是恒定的群体和消费是可变的群体。然后，我想根据峰值的函数和它们消耗of的时间对变量消费者进行聚类。我也试着计算每个客户端的平均et方差，然后用k-mean对其

浏览 2提问于2017-01-16得票数 0

1回答

在Cognos11中将自定义颜色应用于条形图

、、、、

我要求在Cognos11 report studio中以用户指定的特定颜色显示堆叠和聚类条形图。我已尝试使用图表属性中提供的调色板选项，但无法应用我喜欢的颜色。在Cognos11report Studio中有什么方法可以做到这一点吗？

浏览 6提问于2019-02-27得票数 0

2回答

基于功能的基因聚类

、、、

我们希望使用分层或k均值聚类，根据基因的功能对数据集中的基因进行聚类。我们得到了每个基因的GO id，现在我们想根据功能将它们分组，最好是分层的。这意味着从底层(每个函数都是唯一的)到上层(我们有更多的泛化/函数组)。我们正在用R编写程序。提前感谢您的帮助！

浏览 2提问于2014-03-10得票数 0

1回答

条形图条形宽度在jasper中非常细

、、

我在ireport 3.0中创建了一个条形图，问题是条形图非常细。当我尝试通过customize r类增加条的宽度时，它没有反映条的大小的任何变化，即宽度与以前相同。那么如何增加条形图的条形宽度呢？我附上一份图像副本，以供您了解。条形宽度如图所示。

浏览 0提问于2015-11-07得票数 1

1回答

贝叶斯层次聚类

您知道我们是否可以在具有浮点值的向量上实现贝叶斯层次聚类(python或R)？我在网上搜索过，只找到了一些值为0,1,2的随机矩阵，在相关的论文中没有提到。我也尝试用R实现它，它返回了一个致命的错误，RGui和RGui突然关闭了，我不确定是不是因为浮点值的原因。

浏览 4提问于2020-01-21得票数 0

1回答

使用预定义的距离/相似矩阵进行r数据聚类

、、、、

提出了一种新的文档相似度度量(一种计算文档间相似度/距离的方法)。我要知道这个措施有多好？聚类是一个基于距离/相似性度量的应用程序。因此，我决定在不同的数据聚类算法中评估所提出的测度的有效性。我读过关于的文章。假设我有一个文档集合D，它包含n文档，组织在k集群中。我想评估我的相似性/距离度量在各种聚类算法(分区、分层和基于主题的算法)中的应用。问题是，所有的示例和教程都是从"data“矩阵开始的，但是我有一个矩阵。你能帮我找一些关于R的线索吗？

浏览 0提问于2014-02-19得票数 0

回答已采纳

1回答

内存问题:平均链接聚类

、、、、

有100万行和18列的数据需要使用平均链接聚类来进行聚类，而这又需要计算行之间的欧几里德距离。在这样做时，d <-dist(data)，R会给出以下错误：错误:无法分配大小为3725.3 Gb的向量我的电脑有32 Gb的内存。我的方法应该是什么？

浏览 5提问于2021-12-28得票数 0

1回答

K-均值聚类对使用PCA和原始数据减少的数据有什么不同吗？

、、、、

我正在做聚类工作，我有90个特征，有13500个数据点，去除了相关变量，其中皮尔逊相关性超过90%，我的特征空间减少到70个。而且，几乎所有我最初的90个特性都有大量的零值(超过70%-80%的数据点)。我在算法实现方面所做的是： Ran K-通过根据轮廓指数选择聚类数来表示原始数据的70个特征(均为数字)。 Ran K-通过根据剪影索引选择簇数将维度降到2。我所观察到的和我相应的问题是： K-表示pca减少的数据提供了更好的聚类。有什么办法可以让我用这个集群来解释吗？就像从pca分配聚类标签一样，将数据减少到原始数据原始数据上的K-均值和pca上的K-均值是如何不同的？我知道pca会将数

浏览 0提问于2020-01-21得票数 3

2回答

层次聚类

、

我已经阅读了一些参考资料，并了解了层次聚类的工作原理。然而，当我将其与k-means聚类进行比较时，在我看来，k-means确实构成了特定数量的聚类，而层次分析则向我展示了如何对样本进行聚类。我的意思是，在分层聚类中，我没有获得特定数量的集群。我只得到了一个关于集群如何构成的方案，以及样本之间的部分关系。因此，我无法理解在哪里可以使用这种聚类方法。

浏览 4提问于2018-04-24得票数 1

1回答

在D3中的可排序条形图中创建聚类

、

我在D3中制作了一个条形图，总共有18个条形图，我试图展示所有的条形图是如何聚集成低、中和高的范围(每个范围六个条形)。我希望这些聚类之间有视觉上的差距(因此它们是明显不同的)-问题是，可以根据图表中没有显示的其他数据对条形进行重新排序(考虑人口统计数据，以了解条形如何以不同的方式聚类)。这是我用来制作和排序条形图的代码 svg.selectAll("rect.bars") .data(dataset) .enter() .append("rect")

浏览 0提问于2013-08-23得票数 0

1回答

如何在层次聚类中确定聚类个数

、

我在使用R中的Ward最小方差的等级聚类中发现了下面的聚类模式。我根据个人的特征是否有意义经验地决定了五个集群的数量。即使我使用一个高度(在图中用“cut”线表示)，我仍然可以得到相同的4个簇，但是第五个簇(蓝色的)又减少了两个簇。问:我的问题是，是否必须在特定高度上削减第5个集群，即使根据基于知识的研究，这是没有意义的？或者我可以凭经验决定保留5个集群？它是否在分析中引入了任何偏见？

浏览 1提问于2020-02-26得票数 0

1回答