腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
使用
python
仅
聚
类
二进制
矩阵
中
的
列
python
、
python-3.x
、
matrix
、
cluster-computing
、
distance
我需要一些帮助才能将我
的
binary values集群到我
的
矩阵
中
。这是一个
二进制
矩阵
,下面是一个例子: G1 G2 G3 G4 G5 G6 G7 G8 G9 G10 G11 G12Sp1 0 0
浏览 14
提问于2020-04-24
得票数 0
2
回答
数据挖掘:基于两个文本值(ID)和一个数字(比率)进行分组
python
、
ruby
、
data-mining
、
data-analysis
对于一个音乐项目,我想找出哪一组艺术家是用户听
的
。我从数据库中提取了三
列
:艺术家
的
ID、用户
的
ID和连接到该艺术家
的
所有用户流
的
百分比。用户15的话剧一半是艺术家
的
12部。12 - 15 - 0.5 我希望找到
的
是一种将一组组聚在一起
的
方法,例如,找出那些倾向于听艺术家12
的
用户也会听65、74和34。我想知道这种分组可以
使用
什么样
的
方法,以及这种方法是否有很好
的
浏览 3
提问于2013-09-09
得票数 0
回答已采纳
1
回答
相似度
矩阵
的
聚
类
技术
cluster-analysis
、
hierarchical-clustering
、
clustering-key
我有128个受访者
的
二进制
数据,基于他们所选择
的
数码相机
的
功能。其中'1‘代表特征
的
选择,而'0’代表未选择
的
特征。我在
列
中有92个产品特性,在行中有响应者。我想根据他们选择
的
功能创建不同用户组
的
集群。我在这些
二进制
数据上尝试了一些
聚
类
算法,比如模糊
聚
类
和层次
聚
类
,但它没有给我任何好
浏览 5
提问于2017-03-07
得票数 0
2
回答
python
中
二进制
数据距离
矩阵
的
计算
python
、
hierarchical-clustering
、
euclidean-distance
、
distance-matrix
我正在
python
中
执行分层聚类分析。我
的
变量是
二进制
的
,所以我想知道如何计算二元欧几里德距离。根据文献,利用这种
聚
类
技术可以
使用
这种距离度量。我
使用
的
是scipy.spatial.distance.pdist(X, metric='euclidean'),但是这个函数对非
二进制
数据
使用
欧氏距离。有没有基于二元欧氏距离度量计算距离
矩阵
的
浏览 0
提问于2018-08-16
得票数 2
4
回答
在scikit-learn
中
,DBSCAN可以
使用
稀疏
矩阵
吗?
machine-learning
、
scikit-learn
、
cluster-analysis
、
data-mining
、
dbscan
在运行scikit
的
dbscan算法时,我得到了内存错误。我
的
数据大约是20000*10000,它是一个
二进制
矩阵
。无论如何,我找到了scikit
的
稀疏
矩阵
和特征提取。但我仍然不知道如何
使用
它。
浏览 0
提问于2013-04-19
得票数 10
1
回答
二进制
稀疏数据UMAP降维
的
最佳度量和超参数
dimensionality-reduction
、
binary
、
sparse
我正在对一个很大
的
稀疏
二进制
矩阵
进行
聚
类
之前
的
降维步骤,该
矩阵
由近3000
列
和50k行组成。我
的
想法是用UMAP将3000个维度嵌入到一个二维空间中,然后用HDBScan对得到
的
5万个二维点进行
聚
类
。我发现UMAP接受了许多选项,比如metric、n_neighbors、min_dist和spread,但是我不知道什么才是给我提供不同集群
的
最佳组合。对于大多数情况
浏览 0
提问于2021-07-27
得票数 2
2
回答
R
中
的
簇
二进制
矩阵
r
、
matrix
我有一个两个变量之间
的
二进制
矩阵
。我想知道是否有一种方法可以对R
中
的
二进制
矩阵
进行
聚
类
。如果有,我应该
使用
哪种算法?
矩阵
如下所示person1 1 0 0 1person3 1 1 1
浏览 1
提问于2013-12-12
得票数 2
1
回答
构造特征向量学习
聚
类
cluster-analysis
、
feature-extraction
示例:*引文:{*1: cite1,不是,是不是……}我假设根据引用
的
相似度对文档进行
聚
类
,但每个文档都会有很多引用我在这里
的
困惑是,在这种情况下,我是否要为数据集构造特征向量,以便将其提供给我
的
聚
类
工具包( ...how )。 ps。我在机器学习方面的背景相当薄弱-我正在读我
的
课堂讲稿,但大多数都没有
浏览 2
提问于2013-02-23
得票数 1
1
回答
有哪些方法可以评估
聚
类
的
相似性?
python
、
statistics
、
cluster-analysis
、
evaluation
假设我有两种方法对同一数据集进行
聚
类
,并希望计算它们输出
的
相似度。我将不得不计算一些类似于相关性
的
东西,但集群标签是一个分类变量。我考虑过
使用
卡方,但当
列
联表
中
的
多个单元格<5时,不建议
使用
卡方(当
聚
类
非常相似时,这将经常发生)。另一个线索是
使用
Fisher
的
精确测试,但
Python
scipy实现只适用于2x2
的
浏览 32
提问于2020-03-30
得票数 0
3
回答
是否对hclust链接
使用
不同度量?
r
、
cluster-analysis
在R
中
,您可以在
聚
类
之前
使用
各种度量来构建距离
矩阵
,例如
二进制
距离、曼哈顿距离等。然而,当涉及到选择链接方法(完全、平均、单一等)时,这些链接都
使用
欧几里德距离。如果您依赖于差异度量来构建距离
矩阵
,则这似乎不是特别合适。谢谢!
浏览 3
提问于2012-08-30
得票数 2
回答已采纳
3
回答
python
中
基于基因表达
矩阵
的
层次
聚
类
python
、
numpy
、
machine-learning
、
matplotlib
、
scipy
我如何在
Python
中进行分层
聚
类
(在本例
中
是针对基因表达数据),以显示基因表达值
矩阵
和树状图?我
的
意思是像下面这样
的
例子: 如何在
Python
中
使用
numpy/scipy或其他工具执行此操作?另外,用欧几里德距离作为度量,用大约11,000个基因
的
浏览 0
提问于2010-06-05
得票数 3
2
回答
使用
R-lsa包计算语义空间中文档之间
的
余弦相似度
r
、
cluster-analysis
、
text-mining
、
trigonometry
、
lsa
我正在尝试
使用
R语言对类似的文档进行
聚
类
。作为第一步,我为我
的
文档集计算术语-文档
矩阵
。然后,为之前创建
的
术语-文档
矩阵
创建潜在语义空间。我决定在实验中
使用
LSA,因为
仅
使用
术语文档
矩阵
进行
聚
类
的
结果非常糟糕。是否可以
使用
创建
的
LSA空间构建相异
矩阵
(
使用
余弦度量)?我需要这
浏览 3
提问于2013-03-06
得票数 2
1
回答
以一致性
矩阵
为相似
矩阵
的
层次
聚
类
machine-learning
、
clustering
、
similarity
特别是,如果我们将颜色梯度与0-1
的
实数范围相关联,使白色对应于0,而暗红色对应于1,如果我们假定
矩阵
的
排列使属于同一集群
的
项目彼此相邻(
使用
相同
的
项目顺序来索引
矩阵
的
行和
列
),那么对应于完美一致性
的
矩阵
将在白色背景上显示为以红色块沿对角线描述
的
颜色编码热图为了从一致
矩阵
到可视化,作者指出:“我们可以利用一致
矩阵
本身来确定最优
的
浏览 0
提问于2021-02-27
得票数 1
1
回答
R/rpy2
中
as.dist函数
的
内存问题
python
、
r
、
rpy2
我正在尝试
使用
自定义距离度量执行分层
聚
类
。我在
Python
中
执行所有计算,然后将数据结构传递给R进行
聚
类
r=robjects.r from rpy2.robjects.packages
Python
列表
中
,转换为R
矩阵
,然后再转换为集群所需
的
dist对象。但是,当
矩阵
变得太大时,我会得到这样
的
错误:
浏览 1
提问于2011-03-19
得票数 1
回答已采纳
2
回答
超大型(n=140000)
二进制
数据集聚类分析技术?
machine-learning
、
python
、
scikit-learn
、
clustering
此数据集用于英国警方
使用
武力
的
案例。 我计划对其进行聚集性
的
分层
聚
类
,以便在
使用
强制事件时找到模式(通过集群描述),但我无法做到这一点,因为距离
矩阵
总是太大,并且不断崩溃。我尝试通过MCA进行降维(比如PCA,但对于分类变量),但这只是减少了
列
的
数量,而且距离
矩阵
仍然太大(1400x140000需要72.7G
的
RAM)。因此,我正在寻找除分层
聚
类
之外
的</
浏览 0
提问于2020-05-04
得票数 2
2
回答
在
python
中将层次
聚
类
的
结果绘制在数据
矩阵
的
顶部
python
、
cluster-analysis
、
machine-learning
、
matplotlib
、
scipy
在
Python
中
,如何将树状图绘制在值
矩阵
的
顶部,并适当地重新排序以反映
聚
类
?下面是一个示例: 我
使用
scipy.cluster.dendrogram制作树状图,并对数据
矩阵
执行分层
聚
类
。那么,我如何将数据绘制为
矩阵
,其中行已被重新排序,以反映在特定阈值下切割树状图所导致
的
聚
类
,并使树状图与
矩阵
一起绘制?我知道如何在scipy
浏览 5
提问于2010-06-06
得票数 51
回答已采纳
1
回答
K-表示每组
中
的
集群-图类比例。
python
、
machine-learning
、
scikit-learn
、
cluster-analysis
我正在进行一个项目,利用未标记数据集
的
聚
类
结构来提高监督学习
聚
类
算法
的
性能。在对存储在
矩阵
中
的
数据进行预处理之后,我
使用
k-方法对数据进行
聚
类
,如下所示:k = KMeans(n_clusters=40).fit(X) 我将所需
的
标签存储在y
中
。我全神贯注地看不同
的<
浏览 1
提问于2017-03-08
得票数 2
回答已采纳
2
回答
基于随机森林
的
聚
类
相似性
矩阵
:它是如何表现
的
?
clustering
、
random-forest
、
similarity
我
的
背景如下:目的:将实例
聚
为临床有意义
的
亚群体或临床背景,以获得风险亚群体
的
感觉(根据后续结果经过考虑
的
方法(请参阅这篇简短
的
博客文章(读了2分钟)
的
基本原理):利用树叶
中
的
共现得到病人
的</e
浏览 0
提问于2019-04-17
得票数 5
1
回答
如何对r
中
充满字符串变量
的
数据集进行K-means
聚
类
r
、
string
、
cluster-analysis
现在,我有一个充满字符串变量
的
数据集,但我想在此基础上做一个集群项目。在我对所有变量应用as.factor()后,nbclust()仍然不能工作,我该怎么办?
浏览 63
提问于2018-05-31
得票数 -1
回答已采纳
2
回答
对
二进制
值
使用
哪种距离度量?
python
、
machine-learning
、
math
、
cluster-analysis
、
k-means
所以,我已经用
二进制
值转换了
矩阵
,也就是说,如果用户u1喜欢一个项目I1,那么值是1,如果他不喜欢这个项目,那么值是0。 因此,现在我需要对喜欢相似项目的相似用户进行
聚
类
。我已经
使用
K-modes
聚
类
来对它们进行
聚
类
,但我
的
轮廓得分非常低。我不确定我应该
使用
哪种距离度量。欧几里德距离不是解决这个问题
的
好方法。如果我
的
数据
浏览 0
提问于2019-11-20
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
如何使用python中matplotlib库分析图像颜色
Python 谱聚类算法从零开始
Python实现K-means聚类算法
如何搞定那个“花花绿绿”的世界
《Python数据挖掘及大数据分析》第三讲 Kmeans聚类数据分析及Anaconda介绍
热门
标签
更多标签
云服务器
ICP备案
对象存储
实时音视频
即时通信 IM
活动推荐
运营活动
广告
关闭
领券