腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
我需要一个更适合我的
聚
类
算法
的应用程序
web-services
、
cluster-analysis
作为我的MTP的一部分,我公开了一些
聚
类
算法
,
如
kmeans
聚
类
算法
、成对
聚
类
算法
等,作为web服务。现在我必须找到一个现实生活
中
的应用程序来解释我从
聚
类
算法
中
获得的结果。这些
聚
类
算法
获取数据点(每个数据点代表xy平面上的一个点),并使用欧几里德距离对这些数据点进行
聚
浏览 1
提问于2011-04-10
得票数 0
1
回答
使用OpenRefine清除地址-群集完全匹配
csv
、
cluster-analysis
、
openrefine
、
data-cleaning
我正在使用来清理工作表(.csv)
中
的一些地址。如
何在
列
中
聚
类
精确匹配?看来,
聚
类
算法
将对几乎相似的地址进行
聚
类
,这些地址仅在数目上有所不同。RENGAS, SELANGOR56, LORONG RENGAS, SELANGOR 如何使用OpenRefine根据完全匹配对这些地址进行
聚
类
浏览 2
提问于2014-12-04
得票数 0
回答已采纳
1
回答
基于标签的重叠
聚
类
(软
聚
类
)
python
、
algorithm
、
tags
、
cluster-analysis
我正在寻找一种基于twitter提要的hashtag
聚
类
算法
,在该
算法
中
,hashtag不会严格地分配给一个集群。#vegetablefeed 2:#食品#vegetablefeed 3:#食品#水果饲料4:#食品#水果食品#vegetablecluster 2:#食品#水果
浏览 3
提问于2019-10-01
得票数 1
回答已采纳
1
回答
如
何在
聚
类
算法
中
添加
列
python
、
pandas
、
csv
、
data-science
、
k-means
我正在为一个数据科学项目使用flask python框架,我需要在这个集群代码
中
添加
从csv文件中选择的
列
,有人能帮我吗?知道集群代码可以读取这些
列
之后,我可以保存csv文件并从服务器端选择这些
列
,因此我只需要将它
添加
到集群代码
中
import matplotlib.pyplot as plt import pandas
浏览 8
提问于2020-07-01
得票数 1
1
回答
聚
类
算法
中最重要和最不重要的特征
clustering
、
feature-selection
、
k-means
我正在试验
聚
类
算法
,比如K-均值。现在,我使用所有变量作为
聚
类
算法
的输入。我想知道是否适合对
聚
类
算法
进行特征选择。也就是说,如何找到那些对集群最重要或最不重要的变量。对于我知道真正的
聚
类
是什么的情况,我的想法是使用不断增加的变量组合子集作为
聚
类
算法
的输入,计算预测组和真实组之间的关联表,应用一些度量(比如准确性)来找到得分最差或最好的特征组合。您
浏览 0
提问于2021-10-16
得票数 0
2
回答
不带输入参数的数据
聚
类
parameters
、
machine-learning
、
hierarchical-clustering
这更多的是一个理论问题: 您是否知道任何不需要任何输入参数的
聚
类
算法
(平面或分层),
如
聚
类
的数量或邻域的大小等?换句话说,您只需将数据作为输入提供给
算法
,并将
聚
类
作为输出。如果在相关文件/文档
中
得到建议,我将非常高兴。
浏览 2
提问于2013-02-08
得票数 4
2
回答
数据挖掘
中
的DBSCAN
算法
和
聚
类
算法
algorithm
、
data-mining
、
cluster-analysis
、
dbscan
如
何在
分类数据(蘑菇数据集)上实现DBSCAN
算法
?你能提供一遍
聚
类
算法
的伪代码吗?
浏览 1
提问于2011-04-16
得票数 2
2
回答
如何对数据库
中
的数据和使用混淆矩阵后的数据应用kmeans
算法
python
、
database
、
cluster-analysis
、
k-means
我正在尝试对我的数据库
中
的数据应用K均值
算法
。首先,我像这样获取数据:因此,我的问题是如何使用字符串将
列
转换为数字,
如
"trash"=1,"car"=2 "truck"=3,以及是否可以使用所有
列
和值进行
聚
类
。
浏览 1
提问于2018-01-25
得票数 0
2
回答
我应该使用哪种集群技术?
artificial-intelligence
、
categorization
user access matrix..each行代表用户,每一
列
代表该用户访问的页面类别。这种双
聚
类
技术将首先生成用户集群,然后生成页面clusters.after,它将用户集群和页面集群结合起来生成双集群。现在,我不知道应该使用哪种集群技术来实现此目的。最好的
聚
类
将从该矩阵生成一致的双色图。
浏览 2
提问于2014-05-07
得票数 0
1
回答
机器学习
算法
在数据属性子集中的应用
python
、
clustering
、
bigdata
、
categorical-data
、
dimensionality-reduction
将机器学习
算法
(
如
K-均值
聚
类
、降维和回归)应用于数据集子集是否明智?例如,首先将K-均值
聚
类
应用于数值
列
,然后将结果与分类数据集连接起来。
浏览 0
提问于2018-02-28
得票数 1
回答已采纳
1
回答
对标记数据集进行
聚
类
machine-learning
、
classification
、
clustering
、
k-means
、
unsupervised-learning
我有一个有29个
类
的大标记数据集。在这个数据集中是否可以使用
聚
类
算法
(
如
k均值),或者因为
聚
类
算法
是无监督的,所以是不可能的?
浏览 0
提问于2018-05-22
得票数 3
回答已采纳
1
回答
高维
聚
类
+一些基本内容
algorithm
、
cluster-analysis
、
bigdata
、
dimension
我研究支持向量机(,SVM)已经有一段时间了,最近我开始阅读关于
聚
类
的文章。在使用支持向量机时,我们不需要担心数据的维数大小,但是在
聚
类
中
,由于“维数的诅咒”,尺寸大小是个大问题。此外,稀疏性和数据大小对您选择的
聚
类
算法
也有很大的影响。所以我有点理解聚
类
没有“最佳
算法
”,这完全取决于数据的性质。 话虽如此,我还是想问一些关于集群的基本问题。在本文的第649页“
聚
类
算法</e
浏览 3
提问于2014-04-30
得票数 3
回答已采纳
5
回答
分布式层次
聚
类
algorithm
、
cluster-analysis
、
hierarchical-clustering
有没有什么
算法
可以帮助层次化
聚
类
?谷歌的map-reduce只有一个k
聚
类
的例子。在分层
聚
类
的情况下,我不确定如
何在
节点之间分配工作。我找到的其他资源是:,但不清楚使用了哪些
算法
。
浏览 1
提问于2008-09-17
得票数 22
回答已采纳
1
回答
调整兰特指数(ARI)
machine-learning
为什么在
聚
类
方法中使用调整后的rand指数(ARI)和归一化互信息(NMI)比简单的测试分数(
如
MSE)得到更好的测量结果?我明白,在
聚
类
算法
中
,哪一个点属于哪一个
聚
类
是很重要的,标记是任意的。
浏览 7
提问于2016-10-26
得票数 1
回答已采纳
2
回答
聚
类
一长串单词
string
、
cluster-analysis
、
k-means
、
levenshtein-distance
、
pattern-recognition
我需要对这个单词列表进行
聚
类
,以便类似的单词,例如具有相似编辑(Levenshtein)距离的单词出现在同一组
中
。例如,“
算法
”和"alogrithm“应该有很高的机会出现在同一个集群
中
。在模式识别的文献
中
,我对经典的无监督
聚
类
方法
如
k均值
聚
类
、EM
聚
类
等都有很好的认识。这里的问题是,这些方法适用于存在于向量空间中的点。我的手边有串字。根据我的调查结果,
浏览 3
提问于2014-11-07
得票数 2
回答已采纳
1
回答
使用Dunn指数对
聚
类
算法
进行评估的优点是什么?
machine-learning
、
classification
、
clustering
、
unsupervised-learning
、
model-evaluations
聚
类
算法
的评价指标有很多,
如
Calinski-Harabaz指数、Dunn指数、Rand指数等。对于
聚
类
算法
(尤其是K-均值),使用Dunn指标是否比其他指标有什么优势?如果是的话,有哪些优点和缺点?
浏览 0
提问于2018-02-19
得票数 1
回答已采纳
1
回答
增量
聚
类
算法
scikit-learn
、
dataset
、
clustering
、
scipy
我正在寻找一种增量
聚
类
算法
。所谓增量,我指的是从初始数据集开始构建集群的
算法
,它能够逐步吸收新的项/观察,将它们
添加
到现有的或新的集群
中
。
聚
类
的最大数目是先验未知的,预计会随着时间的推移而增长,这意味着,在
算法
在初始数据集上运行之后,我期望收到属于以前从未见过的簇的观测结果。我对这类问题非常陌生,而
聚
类
库
中
的所有
聚
类
算法</em
浏览 0
提问于2022-12-02
得票数 2
1
回答
不同维度的
聚
类
cluster-analysis
、
hierarchical-clustering
、
online-algorithm
在我的
聚
类
问题中,不仅点可以来来去去,还可以删除或
添加
特征。我的问题有没有什么
聚
类
算法
? 具体地说,我正在寻找这些类型的
聚
类
算法
的凝聚层次
聚
类
版本。
浏览 34
提问于2012-07-18
得票数 0
1
回答
使用不同方法对数据进行
聚
类
cluster-analysis
这里的第一
列
(第0
列
)是用户are。另一个表示在另一个文件
中
命名的特征。例如,用户of 1不具有
列
1 (0)的特性,但用户of 4具有(1):4: 1 0 1 1 1 0 1 1 1 ..。现在,我想要对数据进行
聚
类
,并希望使用不同的
算法
,
如
k-means、DBSCAN、层次
聚
类
等。但正如我所读到的,多维数据有几个问题?
浏览 1
提问于2018-01-16
得票数 0
2
回答
采样是降低复杂性的有效方法吗?
clustering
、
sampling
我面临的一个问题是,我需要大量的数据来进行
聚
类
。正如我们所知道的,
聚
类
算法
可能具有很高的O复杂度,我正在寻找减少
算法
运行时间的方法。我想尝试几种不同的方法,
如
预
聚
类
(冠层
聚
类
)或子空间
聚
类
、相关
聚
类
等。但是,我还没有听说过一些事情,我想知道为什么--简单地从我的数据集中获取一个有代表性的样本,在它上运行
聚
<em
浏览 0
提问于2020-11-08
得票数 6
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
数据科学中必须熟知的5种聚类算法
物以类聚,人以群分——带你认识机器学习中的“聚类”算法
R语言聚类算法在新媒体中的场景应用
机器学习理解篇之五-非监督学习应用的一个简单例子
Expectation Maximization算法
热门
标签
更多标签
云服务器
即时通信 IM
ICP备案
对象存储
实时音视频
活动推荐
运营活动
广告
关闭
领券