python聚类算法分类 - 腾讯云开发者社区

文章/答案/技术大牛

发布

1回答

哪种监督学习算法对顾客购买商品进行分类

、、

理想情况下我应该使用什么算法？如果我只能使用numpy，而不需要scipy或scikit (它在服务器上只有numpy)，您会推荐什么算法？编辑:我将适当的单词添加到标题和标签中

浏览 0提问于2018-05-06得票数 1

3回答

如何对(k-均值)聚类模型中的某些特征给予更高的重视程度？

、、、

我用数字和分类变量对数据进行聚类。为了处理集群模型的分类变量，我创建了虚拟变量。然而，我觉得这会对这些虚拟变量产生更高的重要性，因为多个虚拟变量代表一个范畴变量。例如，我有一个分类变量Airport，它将导致多个虚拟变量: LAX、JFK、MIA和BOS。现在假设我也有一个数值温度变量。现在，我的机场变量似乎是温度变量的4倍，集群主要是基于机场变量。

浏览 0提问于2019-04-16得票数 6

回答已采纳

1回答

应用KMeans算法后的混淆矩阵维数

、、、

我正在用Python开发一个代码，将KMeans聚类算法应用于数据集。我初始化的簇数为5，但在应用该算法并进行预测之后，我很想看到混淆矩阵，以检查算法的执行情况。

浏览 0提问于2018-03-21得票数 0

2回答

如何将Python代码与c#代码集成？

、、

我希望将代码python (分层聚类算法)与代码C#集成起来。该项目是将相似的人分成几个类，并使用该算法进行分类。我们使用语言c# (asp.net)，并希望有一种方法将算法链接到代码。

浏览 0提问于2019-01-22得票数 7

回答已采纳

1回答

扫描所有机器学习分类器？

、、

我正在使用Weka对一些大型数据集执行分类、聚类和一些回归。我目前正在尝试所有的分类器(决策树、SVM、朴素贝叶斯等)。有没有办法(在Weka或其他机器学习工具包中)扫描所有可用的分类器算法，以找到产生最佳交叉验证精度或其他度量的算法？我也想为我的其他聚类问题找到最好的聚类算法；也许可以找到最低的误差平方和？

浏览 0提问于2013-10-12得票数 1

2回答

寻找聚类算法的准确性

、、

如何找出一个聚类算法的准确性，给出该算法的真实聚类和预测聚类？我在网上搜索，但找不到任何有用的资源。我知道如何计算分类算法的准确率。

浏览 0提问于2013-07-29得票数 0

回答已采纳

2回答

机器学习中的无监督分类

、、

聚类(例如:K-均值，EM算法等)是利用数据点之间的距离度量，在数据集中形成聚类，用于无监督分类。编辑:是的，我的意思是k-意思。

浏览 6提问于2020-11-21得票数 0

回答已采纳

2回答

如何在数学上将分类结果与聚类结果进行比较

、、、、

有没有一种标准的方法来比较分类算法和聚类算法的结果(为了准确性)？我有只有两个真实标签的数据。当我对它运行二进制分类时，很容易检查准确性，但是如果我运行聚类，我要求它将数据聚类到5组中，我如何检查准确性并将其与二进制分类进行比较。我知道聚类不适合(双标签)数据，但是如何从数学上证明这一点呢？

浏览 0提问于2014-04-18得票数 0

1回答

文本聚类算法

、、、

我遇到了一个问题，那就是把大量的句子按意义聚成一组。这类似于一个问题，当你有很多句子，并想按它们的含义分组。如果有人愿意为这个问题提供更好的方法/方法--这将是非常感谢的，因为我对这个话题还不熟悉。

浏览 0提问于2014-08-15得票数 17

回答已采纳

1回答

文本聚类的欧几里德与曼哈顿距离

、、、、

我正在使用Weka尝试不同的聚类算法。当我尝试使用欧氏距离的SimpleKMeans算法时，我得到了较少的错误分类实例，而当我尝试使用曼哈顿距离时，得到了更多错误分类的实例。文本聚类的最佳距离度量是什么?为什么？为什么我得到的结果很不一样？我使用类来聚类评估集群模式。

浏览 3提问于2013-10-12得票数 3

回答已采纳

2回答

数据挖掘中的DBSCAN算法和聚类算法

、、、

如何在分类数据(蘑菇数据集)上实现DBSCAN算法？你能提供一遍聚类算法的伪代码吗？

浏览 1提问于2011-04-16得票数 2

3回答

如何对抗KMeans聚类带来的随机性

、、、

我正在开发一种算法，根据图像数据对不同类型的狗进行分类。该算法的步骤如下：将这些图像表示(特征向量)提供给分类器并进行训练

浏览 0提问于2013-09-07得票数 3

回答已采纳

2回答

图像从多个数字和字符图像聚类，将相似的图像聚类在一起。

、、、、

我的计划：但梦想是美丽的，事实是艰难的。

浏览 0提问于2017-07-13得票数 1

1回答

我正在寻找由Sathe等人定义的相似森林算法的一个实现。在他们的KDD论文(https://www.kdd.org/kdd2017/papers/view/similarity-forests)中。到目前为止，我已经在Python中找到了这个版本，但是作者自己说他的版本是“基本的(不是特别优化的)”。对于我的具体研究，这个版本的算法我没有得到好的结果，我想知道如果有更多的参数调整机会，我是否会得到更好的结果。其他版本是否可以在R或Python中使用？

浏览 0提问于2018-12-21得票数 1

1回答

Word2vec分类与聚类

、、、

我试图使用相似度(可能是余弦)来聚类一些句子，然后使用分类器将文本放入预定义的类中。一袋单词模型会产生很好的输出吗？

浏览 4提问于2017-05-04得票数 0

回答已采纳

6回答

聚类算法是否需要在预处理阶段进行特征缩放？

、、、

功能缩放对聚类算法有用吗？什么类型的特性，我的意思是数字，分类等，是最有效的聚类？

浏览 0提问于2017-09-03得票数 7

回答已采纳

1回答

去除Python或C++中K -Means集群的背景掩码

、、

我正在尝试使用K-Means聚类Python库对图像进行分类。然而，图像中包含的是黑色(蒙版)背景，我要求在聚类之前将其删除，因为它会影响输出结果。我希望使用k-means从图像输出中删除黑色背景类或聚类。我试着在网上寻找解决方案，但到目前为止还没有找到合适的解决方案。有谁知道可以使用Python Library或C++在K -means集群算法中删除不需要的特定类/集群

浏览 1提问于2019-11-20得票数 0

1回答

K-均值聚类Matlab

、、

我的问题是，使用k-means很难获得最优聚类数，所以我想到了使用分层算法来寻找最优聚类数。在定义了我的理想分类后，我想使用这个分类来找到具有k均值的质心，而不需要迭代。data= rand(300,5);Z = linkage(D,'ward');现在我想使用向量T中定义的聚类和to k-means

浏览 3提问于2013-02-28得票数 0

1回答