腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
R
聚类分析
沃德自动删除异常值
r
、
cluster-analysis
、
outliers
我如何在R中编码复制在SAS中进行的
聚类分析
,其中涉及method=Ward和TRIM=10选项,自动删除10%的情况作为异常值?(这个
数据
集有45个变量,每个变量都有一些异常值响应。)当我使用Ward的方法搜索R
聚类分析
时,trim选项被描述为缩短名称而不是删除异常值的东西。 如果我在
聚类分析
之前不整理
数据
集,就会出现一个
大
的聚类,其中有许多代表外围个体的单案例“集群”。
浏览 3
提问于2015-04-11
得票数 1
回答已采纳
3
回答
Python中最快的集群包是什么?
scikit-learn
、
clustering
、
unsupervised-learning
、
efficiency
、
spectral-clustering
我想对1,300列和500,000行的
数据
集进行
聚类分析
。SciKit-学习慢吗?
浏览 0
提问于2023-03-07
得票数 1
回答已采纳
1
回答
在python中对地理编码/(经度/经度)
数据
点进行
聚类分析
的最佳方法是什么?
python
、
machine-learning
、
data-analysis
、
geo
在python中对地理编码/(经度/经度)
数据
点进行
聚类分析
的最佳方法是什么?这方面的任何帮助都将不胜感激。 谢谢
浏览 2
提问于2016-01-27
得票数 1
1
回答
设置图形的布局以便在纸上打印
algorithm
、
printing
、
graph
我们的应用程序显示具有大量节点和边的潜在
大
图。当然,我们使用点这样的东西来布局图形,它们在屏幕上看起来很好。但是,用户希望将它们打印到纸上。
浏览 6
提问于2011-07-08
得票数 3
回答已采纳
1
回答
聚类客户群购买行为
clustering
我有一组
数据
,我想知道它们是否有必要添加到
聚类分析
中。与ONEOFF_PURCHASES_FREQUENCY一样,我不确定它是否有助于进行
聚类分析
。我拥有的
数据
集: ONEOFF_PURCHASES_FREQUENCY,PURCHASES_INSTALLMENTS_FREQUENCY,CASH_ADVANCE_FREQUENCY,PURCHASES_AMOUNT
浏览 0
提问于2022-10-04
得票数 0
3
回答
如何生成具有异常值的不同形状(例如,正方形、圆形、矩形)的双变量
数据
?
r
、
dataset
、
cluster-analysis
、
data-generation
我目前正在寻找一些工具,可以生成不同形状的
数据
集,如方形、圆形、矩形等,以及用于
聚类分析
的异常值。 你们中有谁能推荐一个好的
数据
集生成器用于
聚类分析
吗?有没有办法在像R这样的语言中生成这样的
数据
集?
浏览 1
提问于2011-01-18
得票数 7
1
回答
操作超大型文本文件和
聚类分析
c#
、
python
、
text
、
cluster-analysis
我试图使用一个(非常)
大
的45 to .txt文件,该文件不能使用普通文本编辑器打开。 我想要的基本上是清理它,过滤一些
数据
,总结一些单元格/参数,在每一行中附加一些额外的
数据
,并执行
聚类分析
(可能是使用python或C#,因为我已经开始收集它)。
浏览 0
提问于2018-11-07
得票数 0
回答已采纳
1
回答
由分类
数据
和连续
数据
组成的
数据
集的
聚类分析
?
r
、
cluster-analysis
我一生中从来没有做过
聚类分析
,我整齐地遵循了一本关于如何在R中进行
聚类分析
的书中的步骤。R:无监督机器学习的
聚类分析
实用指南:第1卷(多元分析),Alboukadel Kassambara先生 然而,我遇到了一个问题,因为在这本书中,
数据
标准化取代了数值变量,然而,我有一个由13个变量组成的
数据
集我查过google和一些堆叠溢出问题,我找不到一个明确的答案,比如如何处理分类变量和连续变量组合的
聚类分析
。
浏览 2
提问于2018-07-18
得票数 0
回答已采纳
2
回答
聚类分析
r
、
cluster-analysis
我想对我的
数据
集进行
聚类分析
。我在R中发现的所有软件包都是聚类观测,而不是变量。我想对变量进行
聚类分析
。 如何使用变量执行群集。
浏览 1
提问于2018-07-03
得票数 0
回答已采纳
1
回答
在Python编程中使用numpy和nltk或CLUTO对单词进行聚类
python
、
cluster-analysis
、
nltk
、
cluto
我的部分
数据
如下所示(这只是个例子)。基于这种格式的
数据
,我想做一个聚类(例如,(猫,狗),(马),(驼鸟)共3个聚类)。但是我不能..。(我还必须根据输入
数据
进行一些聚类)
浏览 3
提问于2013-12-26
得票数 1
1
回答
如何在SPSS中获取标明变量的
数据
文件?
cluster-analysis
、
spss
、
hierarchical-clustering
我有
数据
集,并使用SPSS执行
聚类分析
。现在,为了知道哪个阶段和步骤代表哪个变量,我需要有一个
数据
文件,其中指明了哪些变量用于实现
聚类分析
。我已经保存了集群解决方案,但它没有帮助。应执行哪些操作或步骤来获取用于此目的的所需
数据
文件?
浏览 2
提问于2016-12-02
得票数 1
2
回答
我应该使用多少变量来聚类一个巨大的
数据
集?
cluster-analysis
、
spss
、
hierarchical-clustering
我的第一个问题是:我应该使用所有的量化变量来进行
聚类分析
吗?我阅读的所有手册都为集群解决方案选择了一些选定的变量,而不是所有这些变量。第二个问题是,我试图对所有的定量
数据
使用分层聚类,但SPSS通知说: 没有足够的有效案例来执行
聚类分析
。...which意味着我拥有的
数据
集不能用来进行
聚类分析
.在这种情况下,我应该做什么来执行
聚类分析
?
浏览 9
提问于2016-11-15
得票数 0
2
回答
在日历中显示群集
r
、
cluster-analysis
、
hierarchical-clustering
我正在进行分层
聚类分析
。第一列(chr)是日期,不包括在
聚类分析
中。 有办法在日历上显示星系团吗?我有日期列和集群列。
浏览 2
提问于2022-04-08
得票数 0
1
回答
在进行聚类之前,通过对特性(因此是
数据
)进行探索性
数据
分析,我能获得什么价值?
machine-learning
、
data-mining
、
clustering
、
unsupervised-learning
、
k-means
我理解EDA帮助我们对
数据
产生良好和有用的洞察力,这在
数据
理解中至关重要。如果不考虑标准检查和操作,例如-删除异常值、缩放、删除常量值列、删除空/‘零’值列等,以及如果我们有20-30个特性。
浏览 0
提问于2020-01-22
得票数 3
0
回答
K-means聚类不能找到
数据
中的所有聚类
r
、
cluster-analysis
、
k-means
我使用的
数据
集如下所示。正如你所看到的,你会认为k-means
聚类分析
会很容易地找到这些聚类的中心。然而,当我运行K均值
聚类分析
并绘制中心时,我得到了这样的结果。
浏览 10
提问于2017-12-07
得票数 1
回答已采纳
1
回答
只包含范畴变量的大型
数据
集的
聚类分析
python
、
cluster-analysis
、
large-data
我的
数据
包含与每个客户相关的500,000行和8,000个变量(产品ids)。每个变量都是一个热编码向量,它显示客户是否购买了该产品。我尝试用MCA (多重对应算法)减少
数据
的维数,然后使用k均值和dbscan进行
聚类分析
,但结果并不令人满意。 有哪些合适的算法用于高维大型
数据
集的
聚类分析
及其python实现?
浏览 1
提问于2019-05-30
得票数 0
回答已采纳
1
回答
R:使用绘图绘制具有超过15个特性的APcluster结果的
数据
可视化
r
、
data-visualization
、
cluster-analysis
我正在处理一个由43列(测量的特性)和许多行组成的
数据
。经过归一化的
数据
计算出相似矩阵之后,事情进行得很顺利。
浏览 3
提问于2020-03-14
得票数 1
1
回答
MySQL创建跨用户购物车的相似商品的分布或频率列表
mysql
、
grouping
、
cluster-analysis
、
data-mining
、
behavior
集群/组不是预定义的,因为它依赖于
数据
。只要方法可行,任何非编码的有用建议都是受欢迎的。可以在excel中进行简单的
聚类分析
吗?
浏览 0
提问于2014-07-23
得票数 0
1
回答
从Python中的1D和2D
数据
中识别出大量的异常值
python
、
scikit-learn
、
cluster-analysis
、
outliers
、
chunks
data : I在一列中有一个
数据
d,它作为另外两个变量a和b的函数变化,在其他两列中定义。我的目标是识别d中的块或异常值。这些异常值似乎并不是离群值,但就我的情况而言,我想找出那些不属于线性线的
数据
云中的
数据
。 我搜索了一下#1,使用KernelDensity模块更合适,而对于#2来说,使用MeahShift模块是一个很好的选
浏览 4
提问于2015-07-09
得票数 1
回答已采纳
2
回答
为什么我们需要在研究中训练和测试
数据
集?
cluster-analysis
我是
数据
挖掘(文本聚类)研究领域的新手,我有关于训练和测试
数据
集的两个问题。 为什么我们需要分成训练和测试
数据
集?
浏览 3
提问于2012-11-15
得票数 2
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
机器学习聚类分析——k-means文本聚类分析
聚类分析:数据挖掘的关键突破口!
聚类分析(一)
什么是聚类分析?
聚类分析的基本概况
热门
标签
更多标签
云服务器
即时通信 IM
ICP备案
对象存储
实时音视频
活动推荐
运营活动
广告
关闭
领券