腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
NMF
作为
Python
Scikit
中
的
聚
类
方法
、
、
我正在为
NMF
文本数据集群实现一个
Python
脚本。在我
的
工作
中
,我使用
Scikit
NMF
实现,但据我所知,在
Scikit
中
,
NMF
更像是一种分类
方法
,而不是一种
聚
类
方法
。我已经开发了一个简单
的
脚本,在一些示例弧线上工作。我正在对它们进行预处理,并将其
作为
NMF
的
输入。根据我
的</e
浏览 47
提问于2019-01-31
得票数 4
回答已采纳
1
回答
文本
聚
类
算法
、
、
、
我遇到了一个问题,那就是把大量
的
句子按意义
聚
成一组。这类似于一个问题,当你有很多句子,并想按它们
的
含义分组。|A \cup B \ A \cap B|/|A \cup B|这有意义吗?我正在尝试将<e
浏览 0
提问于2014-08-15
得票数 17
回答已采纳
4
回答
我如何与KL-发散聚在一起?
、
我想用KL-散度
作为
我
的
度量来
聚
类
我
的
数据。 然而,如果我想使用KL-散度
作为
我
的
度量,我如何更新我
的
平均值?
浏览 14
提问于2013-02-02
得票数 7
回答已采纳
3
回答
如何应用集成
聚
类
方法
?
、
、
、
、
我需要使用集成
聚
类
方法
,在我
的
数据集中使用
python
。我已经通过使用
scikit
学习库应用了k-均值
聚
类
。我还应用了不同
的
分类
方法
,也发现了集成分类
方法
在科学学习
中
的
应用.现在我感到困惑
的
是,在
scikit
中
是否存在用于集成
聚
类
的
库,或者我如何将集成<em
浏览 0
提问于2018-02-03
得票数 0
3
回答
python
中
的
谱
聚
类
图
、
、
、
、
我想使用谱
聚
类
在
python
中
对图进行
聚
类
。
Scikit</
浏览 9
提问于2017-09-16
得票数 33
回答已采纳
2
回答
截断LDA主题
、
、
虽然我获得了可很好地解释
的
主题(基于最热门
的
单词),但特定文档往往大量加载非常“通用”
的
主题,而不是专门
的
主题--即使文档中最常见
的
单词是专门
的
。 例如,我有一份房地产报告
作为
文档。频率最高
的
单词是"reit",“reit”,"growth“。现在,我有了一个“专门
的
”主题,最热门
的
词正是这三个。然而,专门化主题
的
负载率是9%,32%
的
主题是非常分散<
浏览 23
提问于2021-06-30
得票数 0
1
回答
为什么降维能提高电影海报
的
无监督
聚
类
性能?
、
、
、
、
我正在写一篇论文,试图根据电影海报
的
视觉特征对它们进行
聚
类
。我们
的
目标是将看起来类似的电影海报聚集在一起。我将使用
的
聚
类
算法是K-均值,我已经用剪影系数评估了
聚
类
的
质量。我尝试了以下几点: 在
聚
类
前
浏览 1
提问于2018-10-30
得票数 0
3
回答
文本
聚
类
和主题提取
、
、
、
我正在使用优秀
的
scikit
-learn模块进行一些文本挖掘。我正在尝试对科学摘要进行
聚
类
和分类。 我正在寻找一种
方法
来集群我
的
tf-id表示集,而不必预先指定集群
的
数量。我还没有找到一个好
的
算法,可以做到这一点,而且仍然可以很好地处理大型稀疏矩阵。我一直在研究简单地使用
scikit
-learn
的
kmeans,但它没有一种
方法
来确定最佳集群数量(例如使用BIC)。我也尝试过使用高斯混合模型(使用最好
浏览 2
提问于2013-05-30
得票数 7
1
回答
基于
python
的
词袋模型
的
简单k-means
聚
类
、
、
、
、
associated_value_return_dict.update({user_id: this_user_zero_vector}) 程序
的
输出如下所示: '666': ['0', '1', '1'], '888': ['1
浏览 3
提问于2017-07-03
得票数 2
回答已采纳
1
回答
文档
聚
类
基础知识
、
、
因此,我已经仔细考虑了这些概念一段时间,我
的
理解是非常基本
的
。信息检索似乎是一个很少在野外讨论的话题。 我
的
问题源于文档
聚
类
的
过程。假设我从一个只包含有趣单词
的
文档集合开始。这里
的
第一步是什么?解析每个文档
中
的
单词并创建一个巨大
的
“词袋”类型
的
模型?然后,我是否继续为每个文档创建字数统计向量?如何使用K-means
聚
类
之类
的
<e
浏览 0
提问于2011-11-09
得票数 1
6
回答
实现半监督(约束)集群
的
包有哪些?
、
、
、
我想在半监督(约束)
聚
类
上运行一些实验,特别是使用
作为
实例级成对约束(必须链接或不能链接约束)提供
的
背景知识。我想知道有没有好
的
开源包可以实现半监督
聚
类
?我尝试查看PyBrain、mlpy、
scikit
和orange,但我找不到任何受约束
的
聚
类
算法。特别是,我对约束K-Means或基于约束密度
的
聚
类
算法(如C-DBSCAN)感兴趣。最好使用Mat
浏览 2
提问于2014-01-21
得票数 9
1
回答
如何收集存在于集群中心或边界
的
数据?
、
、
在应用
聚
类
算法后,需要提取存在于
聚
类
中心和存在
聚
类
边界
的
数据。我怎么能通过使用
python
来做到这一点。这是我在集群之后
的
情节: 📷
浏览 0
提问于2018-02-25
得票数 0
2
回答
rapidminer和
scikit
-learn
中
的
DBSCAN算法
、
、
、
、
我正在尝试寻找一种
聚
类
算法,用
python
对名义数据进行
聚
类
。为此,我在RapidMiner上尝试了DBSCAN算法,它处理
的
是名义数据。但是,当我用
scikit
-learn提供
的
DBSCAN算法尝试相同
的
数据集时,它给出了错误,即函数无法将字符串转换为浮点数。rapidminer和
scikit
中
的
DBSCAN是否不同,我如何解决这个问题?另外,如果你告诉我另一种适用于名义数据<e
浏览 3
提问于2014-07-21
得票数 0
1
回答
如何在现有集群(
Python
)
中
检查一个新
的
点
、
、
、
、
我对
聚
类
有些困惑,例如K-均值
聚
类
。我已经为测试部分
的
培训创建了集群,我想知道新
的
点是否已经在集群
中
,或者它们是否可以在集群
中
?我
的
想法是找到每个
聚
类
的
中心,并在训练数据中找到每个集群
中
的
最远点,然后在测试部分,如果新点
的
距离大于阈值(例如1.5倍,最远点),那么它就不能在集群
中
! 这个想法有效和正确吗?有没有
浏览 1
提问于2015-11-17
得票数 2
回答已采纳
1
回答
有哪些
方法
可以评估
聚
类
的
相似性?
、
、
、
假设我有两种
方法
对同一数据集进行
聚
类
,并希望计算它们输出
的
相似度。我将不得不计算一些类似于相关性
的
东西,但集群标签是一个分类变量。我考虑过使用卡方,但当列联表
中
的
多个单元格<5时,不建议使用卡方(当
聚
类
非常相似时,这将经常发生)。另一个线索是使用Fisher
的
精确测试,但
Python
scipy实现只适用于2x2
的
列联式矩阵,我可能会使用更大
的
矩阵(例如10
浏览 32
提问于2020-03-30
得票数 0
1
回答
模糊
聚
类
的
分离测度
、
、
是否有用于模糊
聚
类
的
分离度量,如Sillohete评分?我理解硬
聚
类
算法
的
逻辑,但不确定模糊。是否有一个
Python
包,例如
scikit
-learn?
浏览 0
提问于2021-06-16
得票数 0
回答已采纳
2
回答
运行
Python
代码时尝试在非包中进行相对导入
、
、
、
、
我是
Python
的
新手,不知道如何运行。我收到以下错误:Traceback (most recent call last): File "spectral.py", line 12,
浏览 2
提问于2014-04-17
得票数 0
1
回答
如何将多个
聚
类
算法应用于同一数据集并进行比较?
在那之后,我想看看我从不同
的
方法
中
得到
的
集群。怎样才是正确
的
方法
呢?或者,我应该只使用一种算法来最大限度地提高
聚
类
的
正确性吗?
浏览 0
提问于2020-09-16
得票数 1
1
回答
具有负值
的
NMF
Python
、
、
、
、
我正在使用
Scikit
-Learn
NMF
算法,我想知道是否有任何
方法
可以在算法中使用负值,我需要它来处理BVH文件。我使用
的
是
python
3.7.5 import numpy as npfrom sklearn.decomposition import
NMF
with open('01_01_
NMF
.bvh
浏览 30
提问于2020-04-29
得票数 1
1
回答
分支因子> 2
的
层次
聚
类
?
、
、
我所看到
的
所有在
Python
中
实现
的
层次化
聚
类
方法
(scipy、
scikit
-learn等)一次分离或组合两个集群。这迫使每个节点
的
分支因子为2。为了我
的
目的,我希望模型允许分支因子大于2,这在集群之间有联系
的
情况下是有帮助
的
。 我不熟悉任何分支因子大于2
的
分层
聚
类
技术;它们存在吗?
浏览 3
提问于2017-05-23
得票数 0
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
Python中动态创建类的方法
Python中类方法与类内部变量的互动机制
在Python中如何在main函数中调用类中的方法
面向大数据的图聚类方法
Python用KShape对时间序列进行聚类和肘方法确定最优聚类数k可视化
热门
标签
更多标签
云服务器
ICP备案
腾讯会议
云直播
对象存储
活动推荐
运营活动
广告
关闭
领券