腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
在
DBLP
数据
集中
查找
聚
类
数
cluster-analysis
我正在尝试使用研究领域来
查找
DBLP
V11
数据
集中
的
聚
类
数
。我已经尝试使用doc2vec预训练和word2vec预训练平均,并使用DBSCAN、层次
聚
类
对结果进行
聚
类
,并使用肘部方法、轮廓方法和差距统计获得
聚
类
的数量。
浏览 16
提问于2019-05-22
得票数 0
1
回答
作者姓名消歧
数据
database
、
author
、
pubmed
、
disambiguation
我想对引用记录进行
聚
类
。我需要训练
数据
和测试
数据
,其中每个出版物记录的真正作者是可用的。有许多书目
数据
库,如
DBLP
,Medline和Pubmed等。我对测试阶段感到困惑。将
DBLP
划分为训练和测试是否是一种好的做法?是否手动添加
DBLP
引用记录?我能保证每个引用记录都被分配给
DBLP
中的真实作者吗?对训练和测试
数据
库有什么建议吗?注意:
在
文献中,我注意到
在
一些论文中,他们使用Pu
浏览 5
提问于2016-06-21
得票数 0
1
回答
什么是光谱
聚
类
?
clustering
什么是光谱
聚
类
?我几乎没有统计学的背景。我试着在网上搜索笔记,但他们假设了很多知识。 如果你能在网上找到一些关于光谱
聚
类
的基础知识和数学基础的笔记,那就更好了。
浏览 0
提问于2018-06-21
得票数 4
2
回答
层次
聚
类
machine-learning
、
hierarchical-clustering
我已经阅读了一些参考资料,并了解了层次
聚
类
的工作原理。然而,当我将其与k-means
聚
类
进行比较时,在我看来,k-means确实构成了特定数量的
聚
类
,而层次分析则向我展示了如何对样本进行
聚
类
。我的意思是,
在
分层
聚
类
中,我没有获得特定数量的集群。我只得到了一个关于集群如何构成的方案,以及样本之间的部分关系。 因此,我无法理解在哪里可以使用这种
聚
类
方法。
浏览 4
提问于2018-04-24
得票数 1
1
回答
两步
聚
类
spss显示具有
聚
类
编号的列
spss
在
spss中,我运行twostep集群。
在
输出控制台中,我可以看到显示集群的图形。 如何在
数据
集中
创建新列并显示每行所属的
聚
类
数
?
浏览 17
提问于2020-01-14
得票数 2
回答已采纳
3
回答
数值
数据
聚
类
python
、
clustering
、
scikit-learn
我试图
在
我的
数据
集中
进行
聚
类
,其中有4个数值字段。请
查找
所附文件:http://www.filedropper.com/example_3.import KMeans我知道在这个例子中有两个
类
,
在
4200行中,前3196行属于
类
,其余行属于另一个
类
浏览 0
提问于2016-12-23
得票数 0
3
回答
我们能自动选择k-均值算法中的k值吗?
k-means
、
partial-least-squares
我们能否自动选择K值,尝试每一个可能的值(k=1,..,n),其中n是要集群的实例数。然后,我们保留K的值,然后用最小二乘和的方法得到最小值。 这个策略能起作用吗?
浏览 0
提问于2020-12-22
得票数 1
1
回答
在
K-均值中找到K的弯头曲线有多可靠?
python
、
r
、
cluster-analysis
、
k-means
、
word2vec
所以我试着用弯头曲线来寻找K-均值
聚
类
中最优的'K‘(簇
数
)的值。我读到的理由是
在
保持平方误差之和(SSE)低的同时,有一个很小的k值。有人能告诉我弯头曲线有多可靠吗?如果我有什么遗漏的话。
浏览 0
提问于2018-09-26
得票数 1
回答已采纳
1
回答
Oracle序列重复
c#
、
asp.net-mvc
、
oracle10g
我的应用程序部署
在
不同的站点上,但使用具有单个
数据
库的
集中
式架构。问题是我选择sequence不在
数据
库中重复
数据
,但是我们部署
在
多个站点的应用程序sequence repeat这里是我的代码 entryid = objDB.CallSequence("SEQ_RESULTTEST
浏览 1
提问于2018-01-26
得票数 0
2
回答
高维最近邻搜索的最佳
数据
结构
algorithm
、
data-structures
、
nearest-neighbor
、
tradeoff
、
approximate-nn-searching
实际上,我正在处理高维
数据
(~50.000~100.000功能),必须对其执行最近邻搜索。我知道KD树的性能随着维
数
的增长而下降,而且我也读过,一般来说,所有的空间分区
数据
结构都倾向于对高维
数据
执行详尽的搜索。(创建
数据
结构的时间并不重要)。 如果使用aNN (近似最近邻)方法更好,那么将其设置得尽可能准确吗?
浏览 6
提问于2015-08-22
得票数 4
回答已采纳
1
回答
如何使用分层
聚
类
来预测新观测的
聚
类
标记?
python-3.x
、
scikit-learn
、
scipy
实际上,
在
我的例子中,使用pdist的n x n将计算距离,我想要计算从一个观察到的距离( o vs n samples o x n )。 谢谢你的高调
浏览 5
提问于2020-10-29
得票数 2
回答已采纳
1
回答
用较小的形状(圆圈)填充多边形
algorithm
、
polygon
、
fill
我只想解释一下我
在
图片上的问题: 有一个基本多边形,但在所有情况下都可以简化为一个圆:输出应该如下所示:没有正确的结果,只有好的和坏的。
浏览 3
提问于2016-02-28
得票数 4
1
回答
聚
类
三维多元
数据
clustering
我正在寻找一个
聚
类
过程,它将根据空间关系和多元维度对一些3D点进行分组。维
数
主要用(区间)度量变量表示,很少由范畴变量组成。我的问题:是否有分析分类维度和度量维度的
聚
类
过程?我的
数据
如下: 0.0000 0.0000 0.0000 0.0084 0.01
浏览 0
提问于2018-06-22
得票数 1
2
回答
哪种算法可以用来降低多个时间序列的维
数
?
python
、
autoencoder
、
pca
、
pytorch
、
dimensionality-reduction
在
我的
数据
集中
,
数据
点本质上是一个时间序列,每个月都有6个特性,因此,总的来说,它会产生6*12=72特性。我需要找到
类
异常值,所以我执行降维,希望保持
数据
的差异,然后应用k均值
聚
类
和计算距离。对于降维,我尝试了PCA和简单的自动编码器将维
数
从72降到6,但结果并不令人满意。 有谁能建议其他减少这类
数据
尺寸的方法吗?
浏览 0
提问于2019-07-28
得票数 1
1
回答
使用具有层次
聚
类
的距离矩阵
查找
聚
类
的数量
r
、
hierarchical-clustering
、
traminer
如何在使用层次
聚
类
时确定最佳
聚
类
数量。如果我只有距离矩阵,因为我只测量成对距离(levenshtein distance ),我如何找到最佳
聚
类
数
?我提到了其他的帖子,他们都使用k-means,层次结构,但不是字符串类型的
数据
,如下所示。关于如何使用R来
查找
聚
类
的数量,有什么建议吗?
浏览 13
提问于2019-08-30
得票数 2
回答已采纳
8
回答
确定k近邻的最佳k值
algorithm
、
language-agnostic
、
artificial-intelligence
、
cluster-analysis
、
complexity-theory
我需要对一组二维
数据
进行聚类分析(我可能会在此过程中添加额外的维度)。 你会推荐什么样的捷径/近似来提高性能。
浏览 9
提问于2009-11-09
得票数 6
1
回答
从平面(2D)中的一组点出发,丢弃孤立的和组剩余的
algorithm
、
geometry
、
graph-theory
我目前正在从事一个需要解决以下问题的项目:然后,我需要能够告诉用户他用来访问该资源的“区域”。所谓的“面积”y可以是指周长(中心和比率)。我打赌一定有一些关于这个问题的文献,但问题是,我甚至不知道这个问题的术语,以及从哪里开始寻找。
浏览 2
提问于2011-11-16
得票数 2
回答已采纳
1
回答
确定K-表示Python中的簇
数
python
、
cluster-analysis
、
k-means
、
data-mining
我将一个轨迹
数据
集保存在一个*.csv文件中,并根据月份对其进行排序。我是说,我按月把它分成了不同的文件。每个文件中的记录
数
是不同的。例如,一月份我有一万张唱片,四月份我有五十万张唱片。我将对每个文件
在
python中执行k均值集群。你能告诉我怎样才能找到或确定的最佳簇数到初始的K 谢谢
浏览 1
提问于2021-03-21
得票数 0
2
回答
R中的集群PAM -如何忽略列/变量但仍然保留它
r
、
cluster-analysis
我想使用R中的集群PAM算法来对大约6000行的
数据
集进行
聚
类
。我希望PAM算法忽略一个名为"ID“的列(而不是
在
集群中使用它),但我不想删除该列。我希望稍后使用该列将群集
数据
与原始
数据
集组合起来。基本上,我想要的是向原始
数据
集中
添加一个集群列。我想使用PAM作为一种
数据
压缩/变量缩减方法。我有220个变量,我想对其中的一些变量进行
聚
类
,并降低
数据
集的维
浏览 4
提问于2013-12-06
得票数 2
回答已采纳
2
回答
聚
类
python中的500万个地理空间点
python
、
cluster-analysis
、
geospatial
目前,我面临的问题是如何在python中对50万纬度/经度对进行
聚
类
。点存储
在
元组中,其中包含纬度、经度和该点的
数据
值。 简而言之,
在
python中对大量的纬度/经度对进行空间
聚
类
的最有效方法是什么?对于这个应用程序,我愿意以速度的名义牺牲一些准确性。编辑:算法要
查找
的簇
数
是未知的。
浏览 2
提问于2014-06-03
得票数 8
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
使用Python进行人脸聚类的详细教程
如何使用python中matplotlib库分析图像颜色
FCS 2017 11(6)微阅读 Top 5 文章
R语言Kmeans聚类、PAM、DBSCAN、AGNES、FDP、PSO粒子群聚类分析iris数据结果可视化比较
小白学Python数据分析之四
热门
标签
更多标签
云服务器
即时通信 IM
ICP备案
对象存储
实时音视频
活动推荐
运营活动
广告
关闭
领券