腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
基于
度量
对
列表
中
的
元素
进行
聚
类
python
、
python-3.x
、
machine-learning
、
cluster-analysis
我有一个字典
列表
,这些字典是关键字及其向量距离,我正在尝试应用
聚
类
技术
对
它们
进行
分组 # data = [{"key": "str1", "weight": float value}, ...] mean_distances_differences = mean([j-i for i, j in zip(distances[:-1], distances[1:])]) 我计算了
列表
浏览 12
提问于2020-11-25
得票数 1
1
回答
选择k均值
聚
类
模型
的
适当相似性
度量
cluster-analysis
、
distance
、
k-means
、
unsupervised-learning
我使用k-means算法
对
我
的
数据
进行
聚
类
。我有5000个样本……(我
的
每个样本都是关于一个客户
的
。为了分析客户价值,我将
基于
4个行为特征
对
它们
进行
聚
类
。)距离是使用欧几里德
度量
和皮尔逊相关性计算
的
。我不知道欧几里德距离是计算距离
的
正确方法还是皮尔逊相关性?我正在使用轮廓来验证我
的
聚</e
浏览 4
提问于2014-08-04
得票数 0
2
回答
基于
相似性
度量
的
图像
聚
类
machine-learning
、
r
、
python
、
scikit-learn
、
k-means
我正在尝试使用科学知识-学习和比辛
对
一组图像
进行
聚
类
-不到100。 最终
的
目标是根据计算出
的
相似性
度量
- CW-SSIM将图像放入几个桶(簇)
中
。这个任务似乎很琐碎,但我无法找到最好
的
方法来处理
基于
相似性
的
集群,在scikit中学习。K-表示
聚
类
看起来是个不错
的
选择,但它不接受任何“比较函数”或自定义距离函数。那么如何处理科学学习
中</e
浏览 0
提问于2016-01-10
得票数 8
1
回答
如何在许多CFG
中
应用?
clustering
、
graphs
我有大约1000个DAG(有向无环图)
的
不同文件显示java.io.BufferedReader
的
使用。下面是其中一个图
的
表示 9 [ label="9 : ROOT:setup()#0" ]; 12 [ label22 -> 34; 27 -> 34; 29 -> 34; 34 ->
浏览 0
提问于2016-02-02
得票数 2
1
回答
K-均值分类
matlab
、
artificial-intelligence
、
k-means
我有一个数据集,我知道它有3个
类
。假设我想用k=10
对
这个数据集
进行
k-means分类,我会得到10个
聚
类
。我如何将这10个集群合并到3个
类
中
,以及
基于
什么规则(例如距离
度量
)? 非常感谢
浏览 2
提问于2017-01-03
得票数 0
1
回答
聚
类
中
的
精确度和召回率(在Spark,Scala
中
的
应用)
scala
、
apache-spark
、
apache-spark-sql
试图解决Spark
中
聚
类
算法
度量
模型评估统计数据(精度和召回率)
的
问题。用于
基于
成对重叠
的
聚
类
评估
的
低于矿工
的
响应。你将如何去计算真正
的
积极因素?特别是
对
spark数据帧
的
变换,得到了结果。非常感谢您
的
启发。
浏览 0
提问于2017-08-05
得票数 0
1
回答
基于
语义相似度
的
分层
聚
类
算法
python
、
similarity
、
semantics
我
对
整个集群和其他方面都很陌生,所以我有点迷失在编程
的
最后一步。我正在做一个
基于
主题语义相似性
的
项目,该项目使用层次化算法
对
学生
进行
聚
类
。如何用python编写代码,根据主题之间
的
语义相似
浏览 5
提问于2022-02-15
得票数 -1
2
回答
在
度量
空间中有
聚
类
的
方法吗?
java
、
cluster-analysis
我想
对
来自Twitter
的
数据
进行
聚
类
。我有用户和他们
的
距离。我不能使用K-means,因为k-means不支持
度量
空间中
的
聚
类
。在
度量
空间中有集群
的
实现吗?
浏览 0
提问于2013-02-20
得票数 0
1
回答
fft输出
的
实部和虚部是否相关?
r
、
math
、
fft
我想使用
基于
模型
的
聚
类
来
对
1225个时间序列(每个24个周期)
进行
分类。我已经使用快速傅立叶变换对这些时间序列
进行
了分解,并选择了至少解释样本中所有时间序列
的
时间序列方差
的
阈值百分比
的
谐波。我想
对
给定时间序列
的
每个变换
元素
的
实部和虚部
进行
基于
模型
的
聚
类
,因为
浏览 29
提问于2011-11-26
得票数 3
回答已采纳
1
回答
三维直方图
的
相似性
度量
image-processing
、
histogram
、
data-mining
、
similarity
、
cv2
我想根据颜色相似性
对
图像
进行
聚
类
。为此,我需要两个3D直方图之间
的
良好相似性
度量
。图像
的
3D直方图只是一个3维空间,其中每个轴代表一种基色。每个轴
的
范围是0-255,因为这是每个像素
的
基色
的
可能值。直方图表示为256X256X256矩阵,矩阵
中
的
每个条目表示图像
中
具有该特定颜色
的
像素计数。例如:如果矩阵
元素
M[0][0][0]
浏览 0
提问于2018-10-23
得票数 0
3
回答
基于
最相似项目
列表
的
聚
类
算法?
machine-learning
、
data-mining
、
clustering
、
dataset
我是机器学习
的
初学者。我有一个大型
的
项数据集,每个数据集中都有有限
的
一组最相似的项,我希望创建集群,最好是每个集群都具有相同
的
大小,尽管这是不必要
的
。有人能给我指明正确
的
方向吗?谢谢。
浏览 0
提问于2018-04-21
得票数 2
1
回答
如何选择合适
的
聚
类
算法
algorithm
、
cluster-analysis
我将使用1000维
的
特征向量
进行
聚
类
。也就是说,特征向量如下所示。.,844};...我也有
度量
两个特征向量之间
的
距离
的
度量
。但我不能确定哪种
聚
类
算法
对
这些特征向量
进行
聚
类
的
效果最好,因为我无法可视化这些向量
的
分布,因为它们
的
维数很高。有谁知道可视化这些分布
的
方法,或者在不知
浏览 2
提问于2013-11-27
得票数 0
1
回答
在数组中找到最相似的范围
c++
、
arrays
、
algorithm
、
data-structures
、
pattern-finding
在这里,calcSimilarity是返回两个数组相似性
的
函数。相似度计算为 不像蛮力搜索那样,我想知道什么样
的
数据结构和算法在范围搜索
中
是有效
的
。
浏览 4
提问于2017-10-04
得票数 1
回答已采纳
2
回答
如何计算dtw
聚
类
的
质量?
r
、
time-series
、
cluster-analysis
、
distance
我
的
目标是
对
关于26周
的
126个时间序列
进行
聚
类
(因此每个时间序列有26个观察值)。我在medoids周围使用了pam{cluster} = partitioning来
对
这些时间序列
进行
聚
类
。在
聚
类
之前,我想比较哪种距离
度量
最合适:欧几里得、曼哈顿或动态时间扭曲。我使用每个距离通过轮廓图
进行
聚
类
和比较。有什么方
浏览 1
提问于2014-04-25
得票数 2
1
回答
可训练簇监督
聚
类
或组ID分配
的
ML纪律名称
machine-learning
、
neural-network
、
classification
是否有一个机器学习算法
的
名称,它从
聚
类
数据点
的
例子中学习“
聚
类
方法”(每次使用不同数量
的
集群)?有没有人在任何文献
中
遇到过类似的问题?我
的
目标是阅读更多关于这个问题
的
内容。而且我们不知道最初
的
故事,而只知道(数据点->他们
的
分组)
的
实例。编辑:也许
聚
类
这
浏览 0
提问于2017-12-11
得票数 0
回答已采纳
1
回答
时间序列
聚
类
质量
度量
clustering
、
time-series
、
unsupervised-learning
、
performance
我是
聚
类
时间序列数据集,这些数据集没有标签(没有根据事实),我想衡量集群
的
质量。你能不能建议一下可以用于时间序列
聚
类
的
聚
类
性能评估方法?
浏览 0
提问于2018-10-06
得票数 1
2
回答
稀疏矩阵
中
聚
类
元素
的
距离
度量
cluster-analysis
、
data-mining
、
distance
、
sparse-matrix
、
k-means
我正在尝试使用K-means
基于
大约1200个二进制变量
对
大约12000个
元素
进行
聚
类
。传统
的
距离
度量
(欧几里得、曼哈顿、汉明、Levenshtein)都没有产生令人满意
的
结果。有没有人使用过类似的方法来解决这类问题?使用这个指标有什么明显
的
缺陷吗?我是数据挖掘
的
新手,如果有任何反馈,我将
浏览 0
提问于2011-03-10
得票数 2
1
回答
将
聚
类
结果绘制并可视化为网络图
python
、
matplotlib
、
graph
、
cluster-analysis
、
networkx
我正在Python中试验各种
聚
类
算法和字符串距离
度量
,最终目标是根据各种距离
度量
对
字符串
列表
进行
聚
类
,例如Levenshtein、Jaro等(每个字符串通常有1到2个单词)。我已经构建了代码,用于根据不同
的
距离
度量
计算字符串之间
的
距离(使用jellyfish包),并使用sklearn.cluster包提供
的
不同算法
对
它们
进行
集群
浏览 0
提问于2018-11-06
得票数 1
1
回答
如何使用LDA或任何主题建模算法获取文档
的
意图
machine-learning
、
nlp
、
lda
、
topic-modeling
我需要
基于
文档
的
意图
对
一组文档
进行
聚
类
,我计划使用LDA(潜在Dirichlet分配-主题建模)。我一直在尝试LDA算法
进行
主题建模,
浏览 0
提问于2019-08-20
得票数 0
4
回答
监督
聚
类
clustering
、
unsupervised-learning
、
supervised-learning
、
semi-supervised-learning
我正在处理一个
聚
类
问题。我有一个训练集,它由一组已知
聚
类
的
点组成,我希望在测试数据集中找到好
的
集群。这是一种监督
聚
类
。 我找了一些关于监督
聚
类
的
文章,但是我没有找到很多信息。有“半监督
聚
类
”,它包括使用关于点
对
(必须链接或不链接关系)
的
信息,但是,在我
的
任务
中
,我没有这样
的
信
浏览 0
提问于2019-09-22
得票数 2
点击加载更多
热门
标签
更多标签
云服务器
对象存储
ICP备案
云点播
腾讯会议
活动推荐
运营活动
广告
关闭
领券