腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
特征选择、
聚
类
、
降
维
算法
的
区别
、
、
、
有人能指出特征选择
和
聚
类
以及
降
维
算法
之间
的
区别吗?
聚
类
帮助我们指出哪些变量簇清楚地定义了输出。这与
降
维
算法
不一样吗?特征选择+
聚
类
不是
和</
浏览 4
提问于2015-10-27
得票数 0
1
回答
机器学习
算法
在
数据
属性子集中
的
应用
、
、
、
、
我有一个庞大
的
混合
数据
集
,它由数值属性
和
分类属性组成,在OneHotEncoding上形成一个具有很高
维
数
的
数据
集
。 将机器学习
算法
(如K-均值
聚
类
、
降
维和回归)应用于
数据
集子集是否明智?例如,首先将K-均值
聚
类
应用于数值列,然后将结果与分类
数据
集
连接起来。
浏览 0
提问于2018-02-28
得票数 1
回答已采纳
2
回答
低密度差多维
数据
聚
类
的
最佳
聚
类
算法
是哪一种?
、
、
、
、
我目前正在做一个项目,我希望对多维
数据
进行
聚
类
。我尝试了K均值
聚
类
和
DBSCAN
聚
类
,两者都是完全不同
的
算法
.K-均值模型返回了相当好
的
输出,它返回了5个簇,但是我已经读到,当
维
数很大时,欧氏距离会失败,所以我不知道我是否可以相信这个模型。在尝试DBSCAN模型时,该模型产生了大量
的
噪声点,并在一个集群中对多个点进行了
聚
类
。我尝
浏览 0
提问于2020-03-31
得票数 2
回答已采纳
1
回答
基于无监督
降
维
的
模糊
聚
类
方法
、
、
、
无监督
降
维
算法
以矩阵NxC1为输入,其中N是输入向量
的
个数,C1是每个向量
的
分量数(向量
的
维
数)。因此,它返回一个新
的
矩阵NxC2 (C2 < C1),其中每个向量
的
分量较少。模糊
聚
类
算法
以矩阵N*C1为输入矩阵,其中N是输入向量
的
个数,C1是每个向量
的
分量数。因此,它返回一个新
的
矩阵NxC2 (C2通常低于C1),其中每
浏览 2
提问于2015-10-13
得票数 3
回答已采纳
1
回答
多维
数据
k均值
聚
类
后
的
主成分分析
、
、
、
、
我有以下10个变量
的
数据
集
:我想用这个多维
数据
集
来识别集群,所以我尝试使用以下代码来实现k均值
聚
类
算法
:data['clusters'] = clustering_kmeans.fit_predict(data) 为了绘制结果,我使用PCA
浏览 9
提问于2021-10-24
得票数 1
回答已采纳
1
回答
在2d空间中生成随机
数据
集
的
脚本
、
、
、
我想分析内核
方法
的
有效性
和
效率,对于以下每种情况,我都需要在二
维
空间中使用3种不同
的
数据
集
: BAD_kmeans: kmeans
聚
类
算法
性能不佳
的
数据
集
。BAD_pca:主成分分析(PCA)
降
维
方法
在将原始点投影到一
维
空间(即第一特征向量)时表现不佳
的
数据
浏览 0
提问于2014-10-18
得票数 3
回答已采纳
3
回答
在具有9个功能
的
数据
集
上应用
和
可视化k均值
聚
类
、
、
、
我有一个
数据
集
的
图像,我已经提取了9个数字特征,我想应用k均值
聚
类
或分层
聚
类
。我只是不知道该怎么做。我读过
的
教程都只有2到3个特性,所以很容易应用
和
绘图。如能提供任何帮助,将不胜感激。下面是我到目前为止掌握
的
代码: ms.fit(numpyArr)cluster_centers
浏览 0
提问于2019-07-30
得票数 1
1
回答
R中
的
ProClus聚类分析
、
、
、
对于我
的
论文作业,我需要对包含从零售店(+1000
维
)购买
数据
的
高
维
数据
集
执行聚类分析。因为传统
的
聚
类
算法
不能很好地适用于高
维
数据
(并且
降
维
并不是一个真正
的
选择),所以我想尝试专门为高
维
数据
开发
的
算法
(例如ProClus)。 然而,在这里,
浏览 3
提问于2016-03-14
得票数 0
2
回答
为什么UMAP与其他
聚
类
算法
结合使用?
、
、
、
我注意到UMAP经常与其他
聚
类
算法
结合使用,例如K-means、DBSCAN、HDBSCAN。然而,据我所理解,UMAP可以用于集群任务。那么,为什么我注意到人们主要把它作为一种
降
维
技术呢?这里是我所说
的
一个例子:https://medium.com/grabngoinfo/topic-modeling-with-deep-learning-using-python-bertopic-cf91f5676504将它与其他
聚
类
浏览 0
提问于2023-03-29
得票数 0
回答已采纳
1
回答
当预定义
的
类别不可用时如何对文本进行分类
、
、
我有一个问题,不知道该应用哪种
算法
。我正在考虑在第二种情况下应用集群,但不知道第一种情况: 我有.5百万张信用卡活动文档。每个文档都定义良好,每行包含一个事务。日期、金额、零售商名称以及零售商
的
简短描述( 5-20个单词)。样本: 2004-11-47,$500,亚马逊,一家提供商品和服务
的
在线零售商,包括书籍,硬件,音乐等。问题: 1.如何对每个条目进行分类,因为没有预先定义
的
类别。2.如果给你预先定义
的
类别,比如“餐馆”、“娱乐”等,你会怎么做?
浏览 0
提问于2011-09-14
得票数 1
回答已采纳
1
回答
一
维
时间序列相似性度量
、
我是时间序列分析
的
新手。我
的
工作主要与时间序列
聚
类
相关。为此,我试图找出一些相似性度量来比较两个时间序列。我已经学习了DTW和约束DTW。是否有其他通常用于此任务
的
相似性度量?我
的
数据
集
在维度(~100)和
数据
点数量(~10000)方面都很大。我不能应用像PCA这样
的
降
维
算法
来
降
维
,因为在进一步
的
工作中需要这样
浏览 4
提问于2015-03-12
得票数 0
1
回答
在特征聚集
维
数
降
维
中,亲和力=“预计算”是什么意思?
、
、
、
在特征
聚
维
降
维
中,亲和力=“预先计算”意味着什么?它是如何使用
的
?但是,我不知道这个“预
算法
”实际上意味着什么,我是否必须为特征聚集
算法
提供“预先计算”
的
内容?“预先计算”究竟是什么意思?除了原始
数据
预处理(缩放),numpy数组之外,我没有传递任何其他内容。在进行特征
聚
类
的
fit_transform后,将结果传递给Birch
聚
类
算法</
浏览 0
提问于2018-09-27
得票数 2
回答已采纳
1
回答
什么是光谱
聚
类
?
什么是光谱
聚
类
?我几乎没有统计学
的
背景。我试着在网上搜索笔记,但他们假设了很多知识。 如果你能在网上找到一些关于光谱
聚
类
的
基础知识和数学基础
的
笔记,那就更好了。我发现像这个一这样
的
笔记需要很多不适合我
的
背景知识。
浏览 0
提问于2018-06-21
得票数 4
5
回答
高
维
二进制稀疏
数据
的
聚
类
算法
、
、
我有一个包含10,000个基因
的
数据
集
,如下所示 1 0 1 1asian每一行都意味着一个人
的
DNA中是否有一个基因。我们正试图根据上述
数据
对不同
的
族裔群体进行分类。但是首先,我们想要使用一些
聚
类
算法
来可视化集群对于不同种
浏览 0
提问于2017-10-07
得票数 7
1
回答
为什么在使用K-Means
聚
类
时,我
的
数据
点不在正确
的
准确集群中?
、
、
、
、
我使用K均值
聚
类
绘制了一些
数据
点。屏幕截图可以在"https://imageshack.com/i/pomMJXMkj“上找到。当我可视化这些
数据
点时,可以清楚地看到许多点不在它们各自
的
集群中,这个绿色
的
点是其中一个远离其质心
的
点,显然非常接近蓝色质心。根据K-Means
算法
,该点被添加到具有最近质心
的
聚
类
中。下面提到了以下可视化
的
浏览 17
提问于2019-05-02
得票数 0
1
回答
umap
的
拟合优度
、
现在我把umap应用到矩阵中,得到一个2_122矩阵
和
一个umap图。如何度量这个umap模型
的
拟合优度?有什么标准
的
方法
吗?
浏览 8
提问于2022-08-05
得票数 0
1
回答
自组织映射与线性矢量量化
、
、
、
、
自组织映射更适合于
聚
类
(
降
维
)而不是分类。但是SOM在线性矢量量化中被用来进行微调。但LVQ是一种监督学习
方法
。因此,要在LVQ中使用SOM,就必须为LVQ提供一个标记
的
训练
数据
集
。但是由于SOM只做
聚
类
而不进行分类,因此不能有标签
数据
,那么SOM如何作为LVQ
的
输入? LVQ是否微调了SOM中
的
集群?在LVQ中使用之前,SOM是否应该通过另一种分类
算法<
浏览 1
提问于2015-12-08
得票数 2
回答已采纳
2
回答
PCA
降
维
后
的
聚
类
、
、
、
假设我们有一个
大
维
的
数据
集
,我们使用PCA将其降到了较低
的
维度,那么对所述
数据
使用
聚
类
算法
是否明智/准确?假设我们不知道会有多少个集群。在Iris
数据
集
上使用PCA ( csv中
的
数据
按顺序排列,以便列出所有的第一
类
,然后是第二个,然后是第三个)生成以下图: 可以看出,Iris
数据
集中
的
浏览 5
提问于2013-09-25
得票数 0
回答已采纳
2
回答
使用t-SNE
降
维
执行
聚
类
、
、
、
问题是应该首先考虑哪一个: a)
聚
类
还是b)
降
维
算法
?换句话说,我是否可以应用一种伪(因为它不是真正
的
)
降
维
方法
,如t-SNE,然后使用
聚
类
算法
来提取
聚
类
,或者是否应该在原始
的
高维空间上执行
聚
类
,并仅用于给节点着色?
浏览 1
提问于2016-06-21
得票数 3
1
回答
同时包含分类变量和数值变量
的
数据
集
的
聚
类
算法
的确定
、
、
、
我是机器学习
的
新手,正在尝试用
聚
类
算法
进行分割。然而,由于我
的
数据
集
既有类别变量(如性别、婚姻状况、首选社交媒体平台等),也有数字变量(平均支出、年龄、收入等),我无法决定哪些
算法
值得关注。我应该尝试哪一个:模糊c均值,k-medoids,还是与k- means ++进行比较
的
潜在
类
?对于这些类型
的
混合
数据
集
,哪些会产生更好
的
结果? 额外
浏览 0
提问于2018-04-26
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
如何为数据集选择正确的聚类算法?
比PCA降维更高级——t-SNE聚类算法实践指南
数据科学家需要了解的5大聚类算法
Python主题建模LDA模型、t-SNE 降维聚类、词云可视化文本挖掘新闻组数据集
面向大数据的图聚类方法
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券