腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
如何
对
R
中
不同
变量
组
的
聚
类
结果
进行
统计
汇总
r
、
group-by
、
cluster-analysis
我想知道是否有一个软件包或快速方法来为
聚
类
结果
生成
统计
汇总
表。我想我可以选择感兴趣
的
变量
并按
聚
类
编号分组,然后计算平均值和最大值等。我正在寻找一种快速
的
方法来做到这一点。有没有我可以用
的
包? 谢谢
浏览 19
提问于2020-09-09
得票数 0
回答已采纳
2
回答
我应该使用哪种集群技术?
artificial-intelligence
、
categorization
user access matrix..each行代表用户,每一列代表该用户访问
的
页面类别。这种双
聚
类
技术将首先生成用户集群,然后生成页面clusters.after,它将用户集群和页面集群结合起来生成双集群。现在,我不知道应该使用哪种集群技术来实现此目的。最好
的
聚
类
将从该矩阵生成一致
的
双色图。
浏览 2
提问于2014-05-07
得票数 0
1
回答
特征选择、
聚
类
、降维算法
的
区别
machine-learning
、
cluster-analysis
、
pca
、
feature-selection
有人能指出特征选择和
聚
类
以及降维算法之间
的
区别吗?
聚
类
帮助我们指出哪些
变量
簇清楚地定义了输出。特征选择+
聚
类
不是和降维算法一样吗?
浏览 4
提问于2015-10-27
得票数 0
2
回答
如何
将更多行添加到esttab
汇总
stat表
中
stata
、
summary
我试图使用esttab创建一个包含
汇总
统计
信息
的
LaTeX表,使用
汇总
命令。,存储它,总结另一行,存储它,等等,然后在不创建不必要
的
列
的
情况下将它们合并到同一个表
中
。如果我想通过
变量
对
每个
变量
进行
个体化
的
限制,那么我可能希望
对
每个
变量
进行
单独
的
总结,以便
对
观察
结果
进行
浏览 3
提问于2016-03-26
得票数 0
回答已采纳
2
回答
在
R
中
过滤聚类分析
中
的
变量
r
、
cluster-analysis
、
pca
、
financial
我正在尝试
对
一个噪声很大
的
金融数据集运行聚类分析(PAM)。 有超过100个
变量
,其中许多是高度共线
的
。考虑到噪声和共线性
的
数量,在整个列数组上运行
聚
类
算法几乎是无意义
的
,我不希望使用PCA,因为我最终将得到每个集群
的
组件,而不是现有
变量
的
范围,我计划进一步分析。在评估由10个
变量
组成
的
已定义
组
的
聚
类<
浏览 7
提问于2018-08-16
得票数 1
2
回答
将
变量
聚集在一起并运行ANOVA
r
、
grouping
、
anova
我想将16个连续
的
(7点Likert Scale)
变量
分成三个单独
的
类别,然后使用一个因子
对
其
进行
方差分析。目前,我在将
变量
聚在一起以使其作为方差分析运行时遇到了问题。这就是我到目前为止所拥有的。"S15" "S16" > lapply(test[,1:16], class)> class(test$Condition)
如何
将<e
浏览 0
提问于2014-11-19
得票数 1
1
回答
如何
只查看少数x
变量
的
汇总
统计
数据
r
我用
R
中
的
lm
对
一个线性模型
进行
了拟合,它有超过1000个虚拟
变量
。经过回归,我得到了一个名为“适合”
的
变量
中
的
汇总
统计
数据。我感兴趣
的
是只提取非常有限
的
10个自
变量
的
系数和
汇总
统计
数据。
如何
才能看到这些
变量
的
汇总
浏览 0
提问于2014-03-12
得票数 1
回答已采纳
3
回答
在
R
中
由群运行
的
数百个线性回归
r
、
linear-regression
我有一个包含3,000+行和10+
变量
的
表。我试图
对
300个
不同
的
组
进行
线性回归,其中一个
变量
作为预测
变量
,另一个
变量
作为响应。我需要每个回归
的
斜率,p值和
r
平方。每个回归和记录
汇总
变量
需要几个小时,如果不是数日的话。我使用了以下包来获取每个
组
的
截距和斜率,但我不知道
如何
为每个
组</e
浏览 1
提问于2018-07-28
得票数 2
回答已采纳
2
回答
聚
类
算法在建立模型之前?
machine-learning
、
clustering
、
dataset
、
k-means
我想了解
的
是,在建立预测模型/模型之前,
如何
使用
聚
类
算法(如果可能的话)在数据集中识别自然出现
的
组
,从而提高模型/模型
的
准确性。
浏览 0
提问于2018-03-05
得票数 0
回答已采纳
1
回答
工作日周末时间序列数据
的
聚
类
time-series
、
clustering
、
k-means
我有一个数据集,说明人们在一天
中
在几个月内采取
的
步骤。我
对
它们
进行
了
汇总
,以便每个人都有一个平均工作日和周末时间序列
的
步骤。1 78 21 46 78 26我尝试使用K均值
聚
类
,通过将平日和周末结合在一起(即每个人只有1例数据)
进行
聚
类
,并显示出两<
浏览 0
提问于2019-05-08
得票数 2
1
回答
可训练簇监督
聚
类
或
组
ID分配
的
ML纪律名称
machine-learning
、
neural-network
、
classification
是否有一个机器学习算法
的
名称,它从
聚
类
数据点
的
例子中学习“
聚
类
方法”(每次使用
不同
数量
的
集群)?有没有人在任何文献
中
遇到过类似的问题?而且我们不知道最初
的
故事,而只知道(数据点->他们
的
分组)
的
实例。编辑:也许
聚
类
这个词不是我明智
的
选择
浏览 0
提问于2017-12-11
得票数 0
回答已采纳
2
回答
混合
变量
(范畴和数值)距离函数
cluster-analysis
、
distance
、
data-mining
我想
对
一
组
作业
进行
模糊
聚
类
。职务属性是:我
的
问题是:
如何
计算
不同
工作之间
的
距离?computer science,(java ,.net,responsibility),1500, 3)PS:我是数据挖掘集群
的
初学者,我非常感谢您
的
帮助。
浏览 0
提问于2011-08-07
得票数 10
回答已采纳
2
回答
如何
计算dtw
聚
类
的
质量?
r
、
time-series
、
cluster-analysis
、
distance
我
的
目标是
对
关于26周
的
126个时间序列
进行
聚
类
(因此每个时间序列有26个观察值)。我在medoids周围使用了pam{cluster} = partitioning来
对
这些时间序列
进行
聚
类
。在
聚
类
之前,我想比较哪种距离度量最合适:欧几里得、曼哈顿或动态时间扭曲。我使用每个距离通过轮廓图
进行
聚
类
和比较。有什么方法可以比较
浏览 1
提问于2014-04-25
得票数 2
1
回答
如何
显示两
组
之间
的
差异(
聚
类
)
r
、
clustering
我
的
数据集由(X,Y)坐标的观测组成,表示某个网格上
的
位置。有两个基于
变量
Z
的
组
,A
组
是Z>10
的
所有点,B
组
是Z<10
的
所有点。将(X,Y)坐标的两组分别
进行
聚
类
,比较星系团
的
位置,得出Z
对
点位置
的
影响是一个好主意吗? 我想用
统计
学
的
方法来说明,如果有的话,A
组
浏览 0
提问于2019-10-22
得票数 1
2
回答
R
中
的
聚
类
时间序列-K均值是否准确?
r
、
time-series
、
cluster-analysis
、
distance-matrix
、
dtw
我
的
数据集是由105个国家(行)
的
14年(列)相同指数
的
测量
结果
组成
的
。我想根据这些国家随时间变化
的
指数趋势
对
其
进行
聚
类
。我正在尝试使用DTW距离矩阵(dtw包)
的
层次
聚
类
(hclust)和K Medoids (pam)。 我还尝试了K均值,使用DTW距离矩阵作为函数kmeans
的
第一个参数。我也在考虑直接使用数据,但我不能理解
结果</e
浏览 7
提问于2020-03-03
得票数 0
2
回答
基于多
变量
的
用户
聚
类
algorithm
、
statistics
、
cluster-analysis
我有一个网站,我收集了很多关于用户行为
的
日志。他们什么时候登录,看什么产品,多久看一次,等等。我想看看我是否能在此基础上
进行
聚类分析,但我不知道
如何
合并多个
变量
。具体来说,我
的
问题是当
不同
的
变量
对
不同
的
组
更重要时,
如何
对
它们
的
重要性
进行
加权,并
对
不同
的
<em
浏览 3
提问于2015-05-29
得票数 1
回答已采纳
1
回答
如何
测试/训练ML管道
中
具有新数据点和
类
的
实时数据模型
machine-learning
、
classification
、
k-means
、
data-science-model
、
python-3.x
首先,对于一个文本分类问题,如果我
对
模型
进行
了2
类
的
训练,并给出了较好
的
精度。现在,当我实时使用该模型时,有一个来自完全
不同
的
业务团队
的
全新
的
类
,我需要使用经过训练
的
模型并
对
这些数据
进行
测试。在这里,很明显,模型会有更糟糕
的
结果
,而且预处理或任何其他数据清理可能会有很大
的
不同
。所以,问题是-唯
浏览 0
提问于2020-03-01
得票数 2
1
回答
为什么
R
和Matlab
中
的
差距
统计
结果
不同
?
r
、
matlab
、
cluster-analysis
我尝试将相同
的
数据放在一起
进行
差距
统计
,并希望获得最优
的
聚
类
数量。为了检查
结果
的
真实性,我尝试使用
不同
的
程序
R
和Matlab
进行
相同
的
测试。然而,
R
和Matlab
中
的
结果
是
不同
的
。
R
的
最佳
聚
类</
浏览 3
提问于2018-12-12
得票数 1
1
回答
ML模型
的
鲁棒性
machine-learning
、
clustering
、
unsupervised-learning
、
autoencoder
在试图模拟类似于这论文中描述
的
ML模型时,经过一些调整后,我似乎最终在一些样本数据上获得了良好
的
聚
类
结果
。“好
的
”
结果
,我
的
意思是很高比例
的
观测
结果
被放入正确
的
聚
类
中
,表明模型确
浏览 0
提问于2018-09-07
得票数 10
1
回答
R
中
具有
不同
范围/尺度
的
连续异质
变量
的
系统
聚
类
r
、
cluster-analysis
、
bioinformatics
、
correlation
、
hierarchical-clustering
我想使用
R
来使用描述相同样本
的
两
组
变量
来执行分层
聚
类
。一
组
是微阵列基因表达数据(针对特定基因),这些数据已经标准化并
进行
了批量效应校正。另一
组
也有一些描述相同样本
的
定量临床参数。然而,这些临床
变量
还没有被归一化或
进行
任何类型
的
转换(即原始连续值)。 例如,其中一个
变量
的
值范围从2到35,而另一个
变量
的<
浏览 13
提问于2017-01-28
得票数 2
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
数据处理进阶篇——如何根据变量类型选择分析方法?
聚类分析稳定性判别的经验总结
统计学最常用的“数据分析方法”清单(一)
聚类分析的基本概况
不止SPSS!百篇数据分析方法合集,真是太太太全面了
热门
标签
更多标签
活动推荐
运营活动
广告
关闭
领券