腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
聚
类
一组
向量
clustering
提供一套(m no.关于n维
向量
,正确
的
无监督
的
聚
类
方法是什么?
向量
本质上代表了
模式
。问题是:是否存在一组
向
浏览 0
提问于2019-06-18
得票数 1
1
回答
具有
相似
模式
的
聚
类
向量
python
、
cluster-analysis
假设我有很多
向量
,其中一些是: a: [1,2,3,4,3,2,1,0,0,0,0,0]c: [1,2,3,2,1,0,0,0,0,0,0,0] 我们可以在
向量
a和c之间看到类似的
模式
。我
的
问题是,是否可以将这两个分类到同一个集群,并将b分类到另一个集群。我不喜欢使用像KMeans这样
的
算法,因为值并不有趣,只有
模式
才有趣。欢迎任何建议,尤其是Phyton中
的
解决方案。谢谢
浏览 17
提问于2020-06-08
得票数 0
1
回答
聚
类
算法
machine-learning
、
data-mining
、
clustering
我有稀疏
向量
,并且发现余弦
相似
度是度量
相似
度
的
有效方法。现在我想根据
相似
性对这些
向量
进行
聚
类
。因此,有人能建议/推荐使用余弦
相似
性
的
聚
类
算法吗? P.S.:我没有预先定义好
的
簇数,而是希望
聚
类
算法自己来决定它。
浏览 0
提问于2017-07-03
得票数 0
回答已采纳
1
回答
基于亲合传播
的
聚
类
doc2vec
scikit-learn
、
clustering
、
word2vec
、
gensim
、
tsne
我希望使用关联传播对文档
向量
(doc2vec)进行
聚
类
。使用余弦
相似
性来
聚
类
我
的
doc2vec文档
向量
正确吗? 此外,我希望使用t
浏览 0
提问于2018-01-04
得票数 1
2
回答
聚
类
一长串单词
string
、
cluster-analysis
、
k-means
、
levenshtein-distance
、
pattern-recognition
我手头有以下问题:我有一个很长
的
单词列表,可能是名字、姓氏等等。我需要对这个单词列表进行
聚
类
,以便类似的单词,例如
具有
相似
编辑(Levenshtein)距离
的
单词出现在同一组中。例如,“算法”和"alogrithm“应该有很高
的
机会出现在同一个集群中。 在
模式
识别的文献中,我对经典
的
无监督
聚
类
方法如k均值
聚
类
、EM
聚
类
浏览 3
提问于2014-11-07
得票数 2
回答已采纳
1
回答
如何将给定样本
聚
类
到谱
聚
类
算法计算
的
类
中心?
machine-learning
、
cluster-analysis
、
spectral
假设我们根据谱
聚
类
算法得到几个
具有
训练样本
的
中心{C1(d1,d2...dn),C2...}。如果一个新
的
测试样本
向量
(x1,...xn),我应该怎么做才能把它放到一个
类
中?请注意,我们在谱
聚
类
过程中使用
的
相似
性矩阵不仅基于训练
向量
之间
的
欧几里德距离,还基于测地距离。因此,距离不能仅用两个
向量
来计算,并且
类
中心也不像我们在K-m
浏览 3
提问于2011-01-05
得票数 2
2
回答
从
相似
矩阵执行
聚
类
python
、
clustering
、
k-means
我有一个歌曲列表,我为每个歌曲提取了一个特征
向量
。我计算了每个
向量
之间
的
相似
度分数,并将其存储在一个
相似
矩阵中。我想根据这个
相似
矩阵对歌曲进行
聚
类
,以尝试识别集群或某种类型
的
歌曲。我使用networkx包从
相似
矩阵中创建了一个力有向图,使用了弹簧布局。然后,我将KMeans
聚
类
用于该图中节点
的
位置,这就产生了有意义
的
集群。但是,我不确定这是否是正
浏览 0
提问于2021-04-15
得票数 1
1
回答
对1000幅图像进行
聚
类
,以找到
具有
更大
相似
性
的
图像组
image
、
image-processing
、
cluster-analysis
我有1000张2D灰度图像,并希望在python中对它们进行
聚
类
,使
具有
更多
相似
之处
的
图像保持在同一组中。图像表示简单
的
几何形状,包括圆、三角形等。如果我把每幅图像都压平成一个
向量
,然后运行
聚
类
算法,那就非常复杂了。图像是400*500,所以我
的
聚
类
训练数据将是1000*200000,这意味着200000功能!
浏览 7
提问于2016-03-10
得票数 2
回答已采纳
1
回答
Weka,如何使用
聚
类
方法对
相似
字符串
模式
进行分组
string
、
attributes
、
cluster-analysis
、
weka
我正在使用Weka
的
聚
类
方法对
相似
的字符串
模式
进行分组。我首先使用了weka
的
stringtowordVector函数,然后直接使用了一些
聚
类
方法,但是我得不到正确
的
结果,有人能给我一些正确
的
方法来对这类数据进行分组吗?acehiadfhjacehiadfhjadfhjadfhjadfhjacfhjadfhjadfhjadfhjadfhjadfhjacehj acehiadfhjacehiadfhjadfhjacfh
浏览 1
提问于2017-07-17
得票数 0
1
回答
将表(
具有
类似
模式
)聚在一起
machine-learning
、
nlp
、
clustering
ID, FirstName, LastName, City, Address, CardID我想对表示类似实体
的
文件当前
的
方法:我尝试了一个
相似
评分b/w两个表,这是基于重叠列b/w,两个表和
相似
b/w
的
表名。table name similarity is computed by computing the dice coeff. of the two tables names
浏览 0
提问于2022-01-31
得票数 0
1
回答
长度归一化
的
应用是什么?
nlp
、
normalization
我找到了一些关于
的
信息。我发现它只在搜索引擎
的
上下文中提到。人们是否为了不同
的
文字目的而使用它?(请原谅我
的
无知。我确实搜索过它
的
其他用途,但是google一直把“正常化”和“缩放”混淆在一起。
浏览 2
提问于2014-01-29
得票数 1
回答已采纳
2
回答
什么是主题建模以外
的
?
nlp
、
topic-model
、
lda
我现在很好奇,是否还有其他方法可以在相同或
相似
的上下文中对文档进行无监督
的
聚
类
? (旁白)是否有任何方法显示一个或多个主题
的
相似
之处?
浏览 0
提问于2018-08-05
得票数 2
回答已采纳
1
回答
基于多词
相似
度
的
聚
类
machine-learning
、
nlp
、
cluster-analysis
、
word-embedding
我正在尝试实现对银行事务数据
的
群集。数据集包含关于Vendor和MCC
的
列,它们是string。这些列中有太多不同
的
值,我想根据一些指标(如cosine similarity for Vendor or MCC )进行集群。(例如,'Hotel A'和'Hotel B'可以在同一个集群中。)我认为Levenshtein distance是不够
的
。 我考虑为MCC找到一个语料库,并建立一个模型来查找单词之间
的
相似
性。这个方法对这个问题有好处吗?如果没
浏览 4
提问于2020-08-08
得票数 0
1
回答
一种面向FastText
的
聚
类
方法
cluster-analysis
、
fasttext
我正在使用预先训练好
的
fastText ()
向量
对短聊天消息执行
聚
类
。这意味着结果
向量
将是组成消息
的
令牌
的
平均值。在这种情况下,如何选择正确
的
聚
类
方法?
浏览 0
提问于2018-08-22
得票数 2
4
回答
聚
类
相似
性度量
machine-learning
、
clustering
、
similarity
我正在处理一个
聚
类
问题。我无法为我
的
系统找到正确
的
相似
性度量。 我有n个
具有
有序
向量
的
节点(例如:1,0,1,0 "1“表示ith对象
的
存在,"0”表示对象
的
缺失)。我想把他们聚在一起。
浏览 0
提问于2018-02-20
得票数 0
1
回答
基于pearson相关
的
聚
类
cluster-analysis
、
data-mining
、
k-means
、
hierarchical-clustering
、
dbscan
我有一个用例,在这里,我每15分钟有一个月
的
流量数据。这些数据是为网络中
的
各种资源收集
的
。我
的
问题是,我应该采用哪种方法来对类似的资源进行
聚
类
?现有的K均值
聚
类
方法都是基于欧氏距离
浏览 6
提问于2015-06-11
得票数 1
回答已采纳
3
回答
基于最
相似
项目列表
的
聚
类
算法?
machine-learning
、
data-mining
、
clustering
、
dataset
我是机器学习
的
初学者。我有一个大型
的
项数据集,每个数据集中都有有限
的
一组最
相似
的项,我希望创建集群,最好是每个集群都
具有
相同
的
大小,尽管这是不必要
的
。有人能给我指明正确
的
方向吗?谢谢。
浏览 0
提问于2018-04-21
得票数 2
1
回答
雪花中
的
自动
聚
类
是如何工作
的
?
snowflake-cloud-data-platform
雪花中
的
自动
聚
类
看起来非常不可预测。上周,我在三个表上创建了一个集群密钥。所有这些表在性质上都是
相似
的,
具有
相似
的摄入
模式
。群集键也位于同一两列上。我注意到
的
是,对于其中一个表,集群比其他两个表
的
触发频率更高。这个特定
的
表是其他两个表中最小
的
。同样,这三个表
的
摄入
模式
也是相同
的
。 我想知道
聚
类
算法是如何工作<e
浏览 1
提问于2020-07-24
得票数 0
回答已采纳
1
回答
如何从其他文本中找到某些词
的
同义词
algorithm
、
machine-learning
、
nlp
我想知道怎样才能从很多文本中找到有类似意思
的
词,比如新闻文章。
浏览 2
提问于2020-03-21
得票数 0
回答已采纳
3
回答
K-表示
具有
CSV
的
聚
类
(
相似
性,doc_id1,doc_id2)?
python
、
csv
、
cluster-analysis
、
tf-idf
、
cosine-similarity
我有一个
具有
以下数据集
的
CSV:1 | 34 | 00.966014701 | 35 | 16其中,“
相似
性”指的是来自tf-国防军余弦
相似
度计算
的
值,而doc_ids指的是文档。因此,
相似
浏览 0
提问于2017-08-16
得票数 1
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
Python 谱聚类算法从零开始
人工智能–SOM算法
机器学习常见的聚类算法
数据挖掘干货总结(四)-聚类算法
数据分享|R语言谱聚类社会化推荐挖掘协同过滤电影社交网站Flixster数据集应用研究
热门
标签
更多标签
云服务器
即时通信 IM
ICP备案
对象存储
实时音视频
活动推荐
运营活动
广告
关闭
领券