NMF作为Python Scikit中的聚类方法

、、

我正在为NMF文本数据集群实现一个Python脚本。在我的工作中，我使用Scikit NMF实现，但据我所知，在Scikit中，NMF更像是一种分类方法，而不是一种聚类方法。我已经开发了一个简单的脚本，在一些示例弧线上工作。我正在对它们进行预处理，并将其作为NMF的输入。根据我的</e

浏览 47提问于2019-01-31得票数 4

回答已采纳

1回答

文本聚类算法

、、、

我遇到了一个问题，那就是把大量的句子按意义聚成一组。这类似于一个问题，当你有很多句子，并想按它们的含义分组。|A \cup B \ A \cap B|/|A \cup B|这有意义吗？我正在尝试将<e

浏览 0提问于2014-08-15得票数 17

回答已采纳

4回答

我如何与KL-发散聚在一起？

、

我想用KL-散度作为我的度量来聚类我的数据。然而，如果我想使用KL-散度作为我的度量，我如何更新我的平均值？

浏览 14提问于2013-02-02得票数 7

回答已采纳

3回答

如何应用集成聚类方法？

、、、、

我需要使用集成聚类方法，在我的数据集中使用python。我已经通过使用scikit学习库应用了k-均值聚类。我还应用了不同的分类方法，也发现了集成分类方法在科学学习中的应用.现在我感到困惑的是，在scikit中是否存在用于集成聚类的库，或者我如何将集成<em

浏览 0提问于2018-02-03得票数 0

3回答

python中的谱聚类图

、、、、

我想使用谱聚类在python中对图进行聚类。 Scikit</

浏览 9提问于2017-09-16得票数 33

回答已采纳

2回答

截断LDA主题

、、

虽然我获得了可很好地解释的主题(基于最热门的单词)，但特定文档往往大量加载非常“通用”的主题，而不是专门的主题--即使文档中最常见的单词是专门的。例如，我有一份房地产报告作为文档。频率最高的单词是"reit"，“reit”，"growth“。现在，我有了一个“专门的”主题，最热门的词正是这三个。然而，专门化主题的负载率是9%，32%的主题是非常分散<

浏览 23提问于2021-06-30得票数 0

1回答

为什么降维能提高电影海报的无监督聚类性能？

、、、、

我正在写一篇论文，试图根据电影海报的视觉特征对它们进行聚类。我们的目标是将看起来类似的电影海报聚集在一起。我将使用的聚类算法是K-均值，我已经用剪影系数评估了聚类的质量。我尝试了以下几点：在聚类前

浏览 1提问于2018-10-30得票数 0

3回答

我正在使用优秀的scikit-learn模块进行一些文本挖掘。我正在尝试对科学摘要进行聚类和分类。我正在寻找一种方法来集群我的tf-id表示集，而不必预先指定集群的数量。我还没有找到一个好的算法，可以做到这一点，而且仍然可以很好地处理大型稀疏矩阵。我一直在研究简单地使用scikit-learn的kmeans，但它没有一种方法来确定最佳集群数量(例如使用BIC)。我也尝试过使用高斯混合模型(使用最好

浏览 2提问于2013-05-30得票数 7

1回答

基于python的词袋模型的简单k-means聚类

、、、、

associated_value_return_dict.update({user_id: this_user_zero_vector}) 程序的输出如下所示： '666': ['0', '1', '1'], '888': ['1&#x

浏览 3提问于2017-07-03得票数 2

回答已采纳

1回答

文档聚类基础知识

、、

因此，我已经仔细考虑了这些概念一段时间，我的理解是非常基本的。信息检索似乎是一个很少在野外讨论的话题。我的问题源于文档聚类的过程。假设我从一个只包含有趣单词的文档集合开始。这里的第一步是什么？解析每个文档中的单词并创建一个巨大的“词袋”类型的模型？然后，我是否继续为每个文档创建字数统计向量？如何使用K-means聚类之类的<e

浏览 0提问于2011-11-09得票数 1

6回答

实现半监督(约束)集群的包有哪些？

、、、

我想在半监督(约束)聚类上运行一些实验，特别是使用作为实例级成对约束(必须链接或不能链接约束)提供的背景知识。我想知道有没有好的开源包可以实现半监督聚类？我尝试查看PyBrain、mlpy、scikit和orange，但我找不到任何受约束的聚类算法。特别是，我对约束K-Means或基于约束密度的聚类算法(如C-DBSCAN)感兴趣。最好使用Mat

浏览 2提问于2014-01-21得票数 9

1回答

如何收集存在于集群中心或边界的数据？

、、

在应用聚类算法后，需要提取存在于聚类中心和存在聚类边界的数据。我怎么能通过使用python来做到这一点。这是我在集群之后的情节： 📷

浏览 0提问于2018-02-25得票数 0

2回答

rapidminer和scikit-learn中的DBSCAN算法

、、、、

我正在尝试寻找一种聚类算法，用python对名义数据进行聚类。为此，我在RapidMiner上尝试了DBSCAN算法，它处理的是名义数据。但是，当我用scikit-learn提供的DBSCAN算法尝试相同的数据集时，它给出了错误，即函数无法将字符串转换为浮点数。rapidminer和scikit中的DBSCAN是否不同，我如何解决这个问题？另外，如果你告诉我另一种适用于名义数据<e

浏览 3提问于2014-07-21得票数 0

1回答

如何在现有集群(Python)中检查一个新的点

、、、、

我对聚类有些困惑，例如K-均值聚类。我已经为测试部分的培训创建了集群，我想知道新的点是否已经在集群中，或者它们是否可以在集群中？我的想法是找到每个聚类的中心，并在训练数据中找到每个集群中的最远点，然后在测试部分，如果新点的距离大于阈值(例如1.5倍，最远点)，那么它就不能在集群中！这个想法有效和正确吗?有没有

浏览 1提问于2015-11-17得票数 2

回答已采纳

1回答

有哪些方法可以评估聚类的相似性？

、、、

假设我有两种方法对同一数据集进行聚类，并希望计算它们输出的相似度。我将不得不计算一些类似于相关性的东西，但集群标签是一个分类变量。我考虑过使用卡方，但当列联表中的多个单元格<5时，不建议使用卡方(当聚类非常相似时，这将经常发生)。另一个线索是使用Fisher的精确测试，但Python scipy实现只适用于2x2的列联式矩阵，我可能会使用更大的矩阵(例如10

浏览 32提问于2020-03-30得票数 0

1回答

模糊聚类的分离测度

、、

是否有用于模糊聚类的分离度量，如Sillohete评分？我理解硬聚类算法的逻辑，但不确定模糊。是否有一个Python包，例如scikit-learn？

浏览 0提问于2021-06-16得票数 0

回答已采纳

2回答

运行Python代码时尝试在非包中进行相对导入

、、、、

我是Python的新手，不知道如何运行。我收到以下错误：Traceback (most recent call last): File "spectral.py", line 12,

浏览 2提问于2014-04-17得票数 0

1回答

如何将多个聚类算法应用于同一数据集并进行比较？

在那之后，我想看看我从不同的方法中得到的集群。怎样才是正确的方法呢？或者，我应该只使用一种算法来最大限度地提高聚类的正确性吗？

浏览 0提问于2020-09-16得票数 1

1回答

具有负值的NMF Python

、、、、

我正在使用Scikit-Learn NMF算法，我想知道是否有任何方法可以在算法中使用负值，我需要它来处理BVH文件。我使用的是python 3.7.5 import numpy as npfrom sklearn.decomposition import NMF with open('01_01_NMF.bvh&#x

浏览 30提问于2020-04-29得票数 1

1回答

分支因子> 2的层次聚类？

、、

我所看到的所有在Python中实现的层次化聚类方法(scipy、scikit-learn等)一次分离或组合两个集群。这迫使每个节点的分支因子为2。为了我的目的，我希望模型允许分支因子大于2，这在集群之间有联系的情况下是有帮助的。我不熟悉任何分支因子大于2的分层聚类技术；它们存在吗？

浏览 3提问于2017-05-23得票数 0

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

文本聚类算法

我如何与KL-发散聚在一起？

如何应用集成聚类方法？

python中的谱聚类图

截断LDA主题

为什么降维能提高电影海报的无监督聚类性能？

文本聚类和主题提取

基于python的词袋模型的简单k-means聚类

文档聚类基础知识

实现半监督(约束)集群的包有哪些？

如何收集存在于集群中心或边界的数据？

rapidminer和scikit-learn中的DBSCAN算法

如何在现有集群(Python)中检查一个新的点

有哪些方法可以评估聚类的相似性？

模糊聚类的分离测度

运行Python代码时尝试在非包中进行相对导入

如何将多个聚类算法应用于同一数据集并进行比较？

具有负值的NMF Python

分支因子> 2的层次聚类？

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐