腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(2645)
视频
沙龙
1
回答
使用
PCA
或
类
似的
东
西从
文本文件
中
获得
聚
类
分配
的
可视化
?
java
、
cluster-analysis
、
pca
、
dimensionality-reduction
我正在尝试执行
PCA
、TSne
或
一些其他类型
的
降维技术,以从以下格式
的
文本文件
中
获得
集群
分配
的
可视化
(其中显示
的
第一列是实例编号,第二列是该实例所属
的
集群。这可以做到吗?任何关于我如何做到这一点
的
建议都将是很棒
的
。
浏览 17
提问于2020-01-09
得票数 0
1
回答
多协变量稀疏矩阵
的
聚
类
clustering
、
sparsity
我想了解数据
中
是否有有意义
的
集群,我开始探索数据转换和规范化
的
维度。 在一个项
的
2000年属性
中
,许多属性是协变
的
(rho > .5)。是否有集群技术可以很好地自动处理协变量,而不必手动删除它们?
浏览 0
提问于2020-02-15
得票数 0
回答已采纳
3
回答
一种可视可分簇
的
聚
类
算法
machine-learning
、
cluster-analysis
、
visualization
、
distance
、
pca
在
使用
PCA
之后,我已经在2D
中
可视化
了一个数据集。1维是时间,Y维是第一个
PCA
分量。如图所示,点(A,B)之间有相对较好
的
分离。但不幸
的
是,
聚
类
方法(DBSCAN,SMO,KMEANS,Hierarchical)不能将这些点
聚
类
到两个
聚
类
中
。正如你在A部分看到
的
,有一个相对
的
连续性,这个连续
的</e
浏览 3
提问于2016-07-30
得票数 1
2
回答
如何在Python
中
可视化
多维集群?
python
、
pandas
、
cluster-analysis
、
k-means
我正尝试在Python语言中测试3种
聚
类
算法(K-means,SpectralClustering,Mean Shift)。我有一个包含26列和数千行
的
数据集,我需要一些帮助来处理高维数据集(子集如下所示)。8 2 9 0 0 6 78 0 32 4 15 3 ... 0 2 4 0 2 1 2 1 0 0 我必须对具有非常高维度
的
数据进行
聚
类
如何
可视化
集群和数据点? 附注:经过一些搜索后,我意识
浏览 47
提问于2021-02-12
得票数 2
1
回答
为什么降维能提高电影海报
的
无监督
聚
类
性能?
cluster-analysis
、
conv-neural-network
、
cosine-similarity
、
unsupervised-learning
、
dimensionality-reduction
我正在写一篇论文,试图根据电影海报
的
视觉特征对它们进行
聚
类
。我们
的
目标是将看起来类
似的
电影海报聚集在一起。根据提取
的
特征,我想:
获得
一张与给定海报最相
似的
海报清单(例如,与马达加斯加海报最相
似的
n张海报)。我将
使用
的
聚
类
算法是K-均值,我已经用剪影系数评估
浏览 1
提问于2018-10-30
得票数 0
1
回答
主成分分析
r
、
correlation
、
pca
、
ggbiplot
我测定了42个不同基因型
的
不同植物性状和环境因素,如辐射
或
温度。我想知道哪些特质是相互关联
的
,哪些特质是相互影响
的
(例如辐射到特质)。于是我就想到了一位常设仲裁官。这是我
的
数据框架
的
一部分(release.year是指基因型
的
发布年份,每一行都是一个度量;每个基因型有多个度量):46 1956 1857.880
浏览 8
提问于2019-11-26
得票数 0
回答已采纳
1
回答
Python:基于word2vec
的
相似词
聚
类
python
、
nlp
、
cluster-analysis
、
word2vec
、
topic-modeling
b],min_count=1,size=32)为了对相
似的
词进行
聚
类
,我
使用
PCA
来
可视化
相似单词
的
聚
类
。但问题是,它只是形成了大
的
集群,从图像
中
可以看到。
PCA
&散点图编码: vocab = list(model.wv.voc
浏览 4
提问于2017-07-31
得票数 0
回答已采纳
2
回答
以簇为颜色
的
R双图
r
、
ggplot2
、
pca
、
factoextra
我在
PCA
变换之后进行
聚
类
,我想在
PCA
空间
的
前两三个维度
中
可视化
聚
类
的
结果,以及原始轴对投影
PCA
空间
的
贡献。我
使用
的
是factoextra库,它
使用
ggplot,并且工作正常,,但是我想从上删除这个传奇。我
的
代码:data(iris) #
PCA
浏览 2
提问于2015-06-17
得票数 4
回答已采纳
2
回答
即使在
PCA
之后,处理不可分离数据
的
可能方法是什么?
classification
、
dataset
、
feature-selection
、
prediction
、
pca
你好,数据科学家,📷非常感谢,
浏览 0
提问于2017-07-14
得票数 2
1
回答
R:相似性传播
中
的
特征选择
r
、
cluster-analysis
、
feature-selection
因此,我正在
使用
亲和性传播APcluster对数据集进行一些
聚
类
。现在我有几个问题想要解决:
浏览 23
提问于2020-03-18
得票数 0
回答已采纳
1
回答
当输入特性
的
数量大于2时,在2d内
可视化
KMeans集群
scikit-learn
、
clustering
、
visualization
、
k-means
我在Python (Scikit-learn)中
使用
KMeans集群,每个样本有大约70个输入特性,还有略多于1000个样本。它表现得相当好,这是好
的
。但是,我很想将结果
可视化
在一个图上,以便更好地检查集群并查看每个集群之间
的
距离。📷
浏览 0
提问于2021-07-16
得票数 0
2
回答
如何在R
中
创建集群图?
r
、
plot
、
cluster-analysis
如何不
使用
在R
中
创建集群图
使用
kmeans
或
类
似的
方法(
使用</em
浏览 4
提问于2012-01-26
得票数 12
回答已采纳
2
回答
带有预定义种群
的
Matlab: K-均值
聚
类
matlab
、
statistics
、
machine-learning
、
k-means
每个种群都是一个NxM矩阵,其中N是固定在两者之间
的
,M是可变长度
的
(每次运行
的
N=column特定属性,M=run数)。我看过
PCA
和K-区分这两种方法
的
方法,但我对最佳实践很好奇。据我所知,在K-
的
意思
中
,没有初始
的
“校准”来选择星系团,这样就可以区分已知
的
双峰种群。它简单地将距离最小化,并将数据
分配
给任意数量的人口。我想告诉
聚
类
算法,我想要两个种群分离
的
最佳
浏览 3
提问于2012-07-30
得票数 0
1
回答
基于
PCA
直线拟合
的
聚
类
算法
python
、
graphics
、
scikit-learn
实现这种类型
的
压缩器
的
标准方法是
使用
PCA
找到主轴,因此您
的
端点是该线两端
的
数据点,然后沿
PCA
轴进行插值以
获得
颜色。该格式支持多个分区-每个分区都有自己
的
颜色端点,数据块
中
的
纹理元素可以
分配
给任何单个分区。将纹理元素
分配
给分区
的
一个常见技巧是对颜色值
使用
kmeans
聚
类
,但这往往会对像素<e
浏览 0
提问于2019-11-17
得票数 1
2
回答
K-均值簇中会有重叠吗?
cluster-analysis
、
k-means
我不清楚为什么k-均值
聚
类
在簇中会有重叠。从陈(2018)身上我看到了以下定义:然而,我看到我
的
情节有重叠之处,我不知道为什么会这样。作为参考,我试图用三个变量(最近、频率、收入)对多维数据集进行
聚
类
.为了
可视化
聚
类
,我可以
使用
PCA
将3D数据投影到2D
中
,并对其运行k均值。=
PCA
(n_c
浏览 8
提问于2020-03-29
得票数 3
回答已采纳
3
回答
哪种最佳/正确
的
算法/程序可以用很多0's对数据集进行
聚
类
?
clustering
、
data
、
k-means
、
pca
、
missing-data
我试图对包含疾病(3456)和症状(25)
的
健康数据集进行
聚
类
,考虑到发生
的
事件
的
数量。我担心
的
是,很多值都是0简单
的
,因为有些疾病并没有显示出特别的症状,例如(我现在合成了这些值):所以,我想知道什么是最好
的
方法来聚集这个数据集。首先,我把事件
的
绝对值转换为总数
的
%,这样就可以处理0's了吗?我想过了,但同时1%接近0%,我不知道算法是否也能理解为“标志”,因为1%代表了症状
的
出现
浏览 0
提问于2018-11-11
得票数 2
1
回答
视觉分析
中
的
主成分分析
visualization
、
data
、
pca
、
dimensionality-reduction
我正在学习视觉分析,我有一个关于这个话题
的
理论问题。📷我不太清楚为什么对数据
使用
PCA
来减少一些我们想要快速呈现
的
数据。广告示例,如果我有带有所有电影(S只是一个例子)
的
数据集和一些属性广告示例。 名称,名称,年份,审查,userReview e
浏览 0
提问于2019-02-23
得票数 0
2
回答
滑雪板
聚
类
提取集群
中
每个标签
的
id
python
、
pandas
、
numpy
、
scikit-learn
、
cluster-analysis
你好,我正在学习如何
使用
Scikit-学习集群模块。我有一个工作脚本,上面写着熊猫
的
数据。array=df.to_numpy()km=KMeans(n_clusters=25,init="random",n_init=100,max_iter=1000,tol
pca
_t[y_km == i , 1],
pca
_t[y_km == i , 2], label = i)所有这些都输出了一个如下所示
的</e
浏览 7
提问于2022-06-28
得票数 0
回答已采纳
2
回答
多元
聚
类
、降维和回归数据分解
regression
、
pca
、
dimensionality-reduction
、
clustering
我认为数据集有些“混乱”,所以我决定先进行一些
聚
类
,然后在每个集群
中
应用回归。考虑到我
的
因变量可能表现出很大
的
变化,我认为我应该对所有变量(因变量和独立变量)进行
聚
类
,因为每个簇都有类
似的
因变量值。首先,我似乎无法确定正确
的
集群数目。“肘部”方法给出了一个不清楚
的
数字,当我用较少
的
数据(大约2000次观测)
使用
它时,我得到了这样
的
结果:我在分层
聚</
浏览 0
提问于2018-11-13
得票数 0
1
回答
pca
和聚类分析,计算非常慢
r
、
cluster-analysis
、
pca
、
factoextra
我
的
数据有30,000行和140列,我正在尝试对数据进行
聚
类
。我正在进行
pca
,然后
使用
大约12台pc进行聚类分析。我随机抽取了3000个观测数据,然后运行了44分钟,同时运行
pca
和层次结构
聚
类
。一位同事在SPSS上也做了同样
的
工作,而且花费
的
时间也大大减少了?知道为什么吗? 下面是我
的
代码
的
一个简化版本,它工作得很好,但是对于任何超过2000次
的
观测结果都很慢
浏览 4
提问于2019-10-31
得票数 0
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
在 FIFA 20 将技能相似球员进行分组(1):K-均值聚类
手把手教你在多种无监督聚类算法实现Python
使用Python实现无监督学习
ML:教你聚类并构建学习模型处理数据
四种无监督变量衍生方法
热门
标签
更多标签
云服务器
即时通信 IM
ICP备案
对象存储
实时音视频
活动推荐
运营活动
广告
关闭
领券