腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
R
中
的
成对
K-
均值
、
我想自动完成,所以必须尝试两个变量
的
所有可能组合,并且只返回最好
的
一个。 我如何在
R
中
做到这一点?您可以使用Iris数据集作为示例。
浏览 18
提问于2019-11-14
得票数 1
回答已采纳
1
回答
将距离矩阵传递到学习
中
的
k-
均值
聚类
、
、
、
按照
的
说法,
k-
指的是shape=
的
矩阵(n_samples,n_features)。但我提供了shape=(n_samples,n_samples)
的
距离矩阵,其中每个索引保存两个字符串之间
的
距离。当我用距离矩阵进行聚类时,它得到了很好
的
结果。可能
的
原因是什么?据我所知,K-medoid是一个与距离矩阵工作
的
。
浏览 2
提问于2017-04-20
得票数 5
2
回答
使用粒子群算法进行聚类比
K-
均值
有什么优势吗?
、
、
我读过一些关于粒子群算法
的
论文。它看起来和
K-
均值
并没有太大
的
不同。我尝试使用粒子群算法进行聚类,但结果与K
均值
的
结果基本相同,存在一些缺点,比如执行时间较长,并且由于随机因素造成
的
结果也有很多不同。
浏览 0
提问于2019-05-25
得票数 1
回答已采纳
1
回答
如何利用k
均值
聚类对MNIST数据集进行分类?
、
、
我正在MNIST数据集上应用
K-
均值
聚类.然后如何根据此预测测试集
的
值?
浏览 1
提问于2016-06-15
得票数 0
回答已采纳
1
回答
K-
均值
聚类
R
-Tree boost
、
、
、
、
我使用
的
是。我在
r
-tree boost
中
添加了10万个点。现在,我想像这个一样对我
的
点进行聚类和分组。似乎我应该从点数来计算
k-
均值
。如何从
r
-tree点几何中计算
k-
均值
?
浏览 17
提问于2018-03-04
得票数 0
回答已采纳
2
回答
如何根据文档
的
相似性度量对文档进行聚类?
、
我阅读了关于这个主题
的
文章,比如如何根据文档
的
相似性对文档进行集群。但我还是不明白它是如何实现
的
。我
的
测试是,我有10个文档
的
cos相似性度量。如果我指定集群
的
数量,该如何做呢?如果我不指定集群
的
数量,算法能否自动对这些文档进行聚类,如何实现呢?提前谢谢。
浏览 2
提问于2015-02-15
得票数 1
回答已采纳
3
回答
如何对(
k-
均值
)聚类模型
中
的
某些特征给予更高
的
重视程度?
、
、
、
为了处理集群模型
的
分类变量,我创建了虚拟变量。然而,我觉得这会对这些虚拟变量产生更高
的
重要性,因为多个虚拟变量代表一个范畴变量。现在,我
的
机场变量似乎是温度变量
的
4倍,集群主要是基于机场变量。 我
的
问题是,我希望所有变量都具有同样
的
重要性。有办法这样做吗?我想用一种不同
的
方式来缩放变量,但我不知道如何对它们进行缩放,以使它们具有同样
的
重要性。
浏览 0
提问于2019-04-16
得票数 6
回答已采纳
1
回答
使用谱
k-
均值
比简单
k-
均值
有什么好处?
、
、
、
我理解为什么k-m会被困在局部
的
最小值
中
.。现在,我很想知道谱k是如何帮助避免这个局部极小问题
的
。根据本文
的
光谱教程,谱算法遵循以下方式用高斯核K或邻接矩阵定义亲和矩阵A求解特征值问题在第6步
中
,它使用
k-
方法.它如何克服<
浏览 0
提问于2022-04-09
得票数 1
回答已采纳
1
回答
当不是所有点都在一个集群
中
时,聚类点
、
我想把重叠点(用红色圈起来
的
)聚在一起,但是,我希望忽略所有其他不重叠
的
点(没有用红色圈起来
的
点)。我不能使用
K-
表示聚类,因为这会对所有的点进行聚类,包括我想被忽略
的
点。我在想我该怎么做。
浏览 0
提问于2019-01-27
得票数 0
回答已采纳
2
回答
基于边缘强度
的
数据点聚类
、
我正在看一个计算机视觉应用程序,在那里我试图分析某一组颜色与另一种颜色形成
的
边缘
的
强度。为此,我拍摄了两种颜色相互重叠
的
图像,并记录了一对颜色
的
边缘强度(通过Canny边缘检测得到
的
归一化值)。基于这个边缘强度数据,我想将使用
的
颜色聚到一个k个簇
中
(k是已知
的
,但是是任意
的
)。将颜色分组,使边缘强度较低
的
颜色对聚在一起,边缘强度较高
的
颜色对最终形成不同
的
簇。例如,如果白色和黄色具有
浏览 5
提问于2015-04-19
得票数 1
回答已采纳
1
回答
基于jaccard距离矩阵
的
Kmeans聚类
、
、
、
、
我正在尝试创建Jaccard距离矩阵并在其上执行K-means,以给出集群in和集群中元素
的
in。它
的
输入是推特推特。下面是代码,我无法理解如何使用文件
中
的
初始种子。
浏览 1
提问于2016-11-29
得票数 4
1
回答
理解pdist与mdscale
的
结合使用
、
、
、
我必须将这些观察分为两组(我有每个观察
的
标签)。 在对观测数据进行聚类之前,我首先计算了观测值之间
的
pdist,然后使用MATLAB
中
的
mdscale函数返回到三维。我使用transformed_observation作为k
均值
聚类算法
的
输入,与使用原始观测值相比,获得了更好
的
聚类结果(即,聚类与标签匹配)。任何人都能解释我为什么?我刚试过..。在这里你可以找到我
的
脚步..。
浏览 1
提问于2016-01-26
得票数 0
回答已采纳
3
回答
在k
均值
中
如何使用欧氏距离以外
的
不同距离公式
、
、
、
、
我必须根据两点之间
的
距离来形成集群。现在两个不同点之间
的
距离是=ACOS(SIN(lat1)*SIN(lat2)+COS(lat1)*COS(lat2)*COS(lon2-lon1))*6371 我想在
R
中使用k
均值
,在这个过程
中
,有什么方法可以超越距离计算吗
浏览 6
提问于2013-12-18
得票数 3
回答已采纳
2
回答
用包含字符串
的
多列进行聚类
、
、
我有以下数据集:https://www.kaggle.com/carolzhangdc/imdb-5000-movie-dataset 我想要找到
的
是基于每个国家
的
imdb得分
的
集群。我已经创建了一个熊猫数据框架,其中包含每个国家
的
每一个独特
的
类型,平均imdb评级。不管怎样,我能实现我想要
的
吗?
浏览 0
提问于2019-04-02
得票数 2
回答已采纳
1
回答
特征
中
两个矩阵
的
两两差
、
、
、
在matlab/octave
中
,矩阵之间
的
成对
距离(如
k-
均值
)由一个函数调用(参见)计算,以distFunc(Codebook, X)为参数,维数为KxD
的
两个矩阵。在Eigen
中
,这可以通过广播对矩阵和一个向量进行,就像在上解释
的
那样然而,在这种情况下在本征
中
,计算两个矩阵之间所有条目的这种
浏览 4
提问于2013-10-09
得票数 3
回答已采纳
1
回答
改进
的
K-
均值
聚类(Ward准则)速度改进
、
、
、
我使用带随机初始化
的
k
均值
聚类来进行聚类识别.算法可以很好地处理好数据。但是如果我处理
的
数据有很多噪声,那么我
的
k
均值
算法就失去了它
的
鲁棒性,并为同一数据集上
的
每次运行提供了不同
的
解决方案。因此,我决定改进我
的
k-
均值
聚类,以最小化Ward标准: 遍历点和所有簇,找到点P和组A和B,所以如果我把点P从A组移到B组,那
浏览 4
提问于2014-05-26
得票数 0
回答已采纳
2
回答
K-
均值
与Mahalanobis距离
我想在
K-
均值
算法中使用Mahalanobis距离,因为我有4个高度相关
的
变量(0.85)问题是我不知道如何用K
均值
算法在
R
中
实现它。我尝试了经典
的
kmeans,在标准化数据上使用了欧几里得距离,但是正如我所说
的
,有太多
的
相关性。fit <- kmeans(mydata.standardize,4) 我还试图找到一个距离参数,但我认为kmeans()函数
浏览 5
提问于2013-04-29
得票数 3
回答已采纳
1
回答
如何在
R
中进行带归一化权值
的
加权k
均值
聚类?
、
1.5478380 0.6823836 -1.06189475 0.9271628 1.3399865 -1.061894 人口数据可能以数百万人为单位,因此我不想使用频率方法(即多次复制行
的
“我是否仍然可以将这个“权重”变量合并到
k-
均值
聚类
浏览 0
提问于2016-03-22
得票数 0
回答已采纳
1
回答
K-
均值
聚类对使用PCA和原始数据减少
的
数据有什么不同吗?
、
、
、
、
Ran
K-
通过根据剪影索引选择簇数将维度降到2。
K-
表示pca减少
的
数据提供了更好
的
聚类。有什么办法可以让我用这个集群来解释吗?就像从pca分配聚类标签一样,将数据减少到原始数据 原始数据上
的
K-
均值
和pca上
的
K-
均值
是如何不同
的
?我知道pca会将数据减少到我选择
的
两个dims,并且保留了最大方差
的<
浏览 0
提问于2020-01-21
得票数 3
1
回答
O(logk)竞争复杂性
的
含义
、
、
现有的算法使用
K-
均值
来执行聚类,而我选择使用
K-
均值
++进行同样
的
聚类。我试着在网络上到处寻找解释,包括堆栈溢出。我唯一理解
的
是,竞争与“在线”和“离线”算法有关。
浏览 2
提问于2017-03-28
得票数 3
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
如何理解K-均值的缺陷和假设
MATLAB用改进K-Means(K-均值)聚类算法数据挖掘高校学生的期末考试成绩
中启资本完成对澳维环保的战略投资
R中的向量化计算
机器学习的第一步:先学会这6种常用算法
热门
标签
更多标签
云服务器
ICP备案
腾讯会议
云直播
对象存储
活动推荐
运营活动
广告
关闭
领券