腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(269)
视频
沙龙
1
回答
Pyspark
:
k
表示
模型
拟
合时
的
聚
类
误差
、
、
、
、
虽然运行
K
意味着使用
pyspark
进行集群,但我使用以下代码行来查找最佳
K
值。但是在
模型
拟合线上经常会出现一些错误。).select('ID','features')拟合
K
均值
的
代码行cost = np.zeros(21) from
pyspark
浏览 47
提问于2020-06-01
得票数 1
回答已采纳
2
回答
如何计算重构
误差
?
、
、
如何计算重建
误差
,在哪里可以找到有关重建
误差
的
信息?(我将在
K
-means算法之后计算我
的
数据
的
重建
误差
)
浏览 2
提问于2011-06-02
得票数 0
回答已采纳
1
回答
使用PyCluster优化
K
(理想簇数)
、
、
、
、
我使用PyCluster
的
kMeans来集群一些数据--很大程度上是因为SciPy
的
kMeans2()产生了无法克服
的
错误。。无论如何,PyCluster kMeans运行良好,我现在正在尝试优化kMeans集群
的
数量。PyCluster附带
的
文献表明,我可以通过实现EM算法-- --来优化它
的
kMeans,但是我找不到一个例子。 有人能给我指个PyCluster
k
-means优化问题吗?提前感谢您
的
帮助。
浏览 1
提问于2013-05-16
得票数 2
回答已采纳
3
回答
如何检验无监督
聚
类
模型
输出
的
准确性?
、
我正在试着测试我
的
非监督
K
-均值
聚
类
是否能够正确地聚集我
的
数据。我有一个无监督
的
K
均值
聚
类
模型
输出(如下面的第一张照片所示),然后使用实际
的
分类对数据进行
聚
类
。下面的照片是实际分类。我试图用Python测试我
的
K
-均值分类(上面)与实际分类相比有多好。📷 对于我
的
K
-
表示</em
浏览 0
提问于2017-03-09
得票数 7
回答已采纳
1
回答
数据簇数比较
的
统计检验
、
、
、
、
我正在由
K
观测和d变量组成
的
数据集上执行-means集群,并试图确定集群
的
最佳数量。是否有一个测试可以确定添加另一个集群
的
统计意义?-1} \Big)} 其中WCSS_i是包含i簇
的
模型
的
群内平方和或惯性之和。得到了F-statistic 这里在“回归问题”下
的
一般公式。在这种情况下,我将惯性作为
模型
中
误差
的
度量,而di是i集群
模型
中
的
参数数,因为每个i簇
浏览 0
提问于2023-03-10
得票数 0
2
回答
带Mahalanobis
的
k
-均值是
聚
类
的
有效选择吗?
、
、
、
我想要更多
的
信息,如果
k
-均值与Mahalanobis距离是一个数学上/方法上正确
的
选择,数据集与不同
的
方差簇。这些步骤是:估计每个聚合/集群数据集
的
mu,sigma 通过计算每个点到每个簇
的
Mahalanobis距离并更新
聚
类
,重新计算
聚
类
。没有办法对Mahalanobis进行“绝对”最佳
聚
类<
浏览 0
提问于2020-01-20
得票数 3
2
回答
什么是主题建模以外
的
?
、
、
我现在很好奇,是否还有其他方法可以在相同或相似的上下文中对文档进行无监督
的
聚
类
? (旁白)是否有任何方法显示一个或多个主题
的
相似之处?
浏览 0
提问于2018-08-05
得票数 2
回答已采纳
1
回答
WEKA如何评估星系团?
、
、
、
生成
聚
类
后
的
Weka集群
表示
并计算实例
的
百分比。如果
聚
类
表示
是概率
的
(例如,对于EM),则对单独
的
测试数据进行
聚
类
。 类属性并生成集群。然后在 它根据每个集群中类属性
的
大多数值将
类
浏览 0
提问于2018-11-29
得票数 1
1
回答
Java/WEKA:
K
聚
类
错误:无法处理任何类属性
、
assignments = kmeans.getAssignments(); e.printStackTrace();我正在尝试用
k
均值算法初始化EM算法
的
参数.因此,我试图得到两个质心,在其中,我可以进一步训练参数
的
GMM。java.lang.NullPointerException at hmm.HMM.main(HMM.java:22) 另外,我如何设置两个随机
的</em
浏览 5
提问于2014-12-17
得票数 2
回答已采纳
1
回答
R:海量
的
聚
类
标准错误::polr()
、
、
我试图使用MASS包
的
polr()函数来估计带有聚集标准错误
的
有序logistic回归。没有内置
的
集群特性,因此我正在寻找(a)包或(b)使用
模型
输出计算集群标准错误
的
手动方法。我计划使用margins软件包来估计
模型
的
边际效应。# Estimate and summarize model对于一般最小二乘
模型
(在某些情况下是
浏览 1
提问于2017-05-26
得票数 2
2
回答
如何在
pyspark
中获得
模型
的
预测
、
、
我已经使用
pyspark
开发了一个
聚
类
模型
,我只想预测一个向量
的
类别,下面是代码 spark = SparkSession.builder.config("spark.sql.warehouse.dirFEATURES_COL, outputCol="features")
k
= 6
浏览 46
提问于2021-01-27
得票数 0
回答已采纳
1
回答
从word2vec
模型
中提取距离矩阵和特征矩阵
、
、
、
我已经为一个巨大
的
语料库生成了一个使用gensim
的
word2vec
模型
,并且我需要使用
k
均值
聚
类
来对词汇表进行
聚
类
,我需要: 对于特征矩阵,我尝
浏览 7
提问于2017-07-24
得票数 0
1
回答
如何比较自组织地图
的
输出?
、
、
我正在尝试使用自组织地图同时对文本文档进行
聚
类
和可视化。由于文本文档可以用各种方式
表示
(向量空间
模型
、GloVe等),所以我想知道如何判断哪种
表示
方式生成最佳地图。量化
误差
等度量,确定给定数据集
的
地图
的
优劣。然而,它们对于定量地判断哪种
表示
形式提供了更好
的
输出并不有用。是否有一种定量
的
度量来比较使用不同
表示
方式生成
的
地图(例如Tf-以色列国防军和GloVe),并指
浏览 0
提问于2019-01-22
得票数 1
1
回答
活动相似度评分
模型
?
、
这是一个非常高层次
的
问题。我正在寻找一种技术或
模型
,可以采取人们
的
网络活动,并能够产生一个基于相似性
的
分数。因此,具有相似流量模式的人,特别是那些在整个集合中不常见的人,得分会高得令人难以置信。我愿意做研究,我只是想得到正确
的
方向。聚类分析是否能够将具有相似活动的人聚在一起?
浏览 0
提问于2015-03-19
得票数 0
2
回答
我应该使用哪种集群技术?
、
user access matrix..each行代表用户,每一列代表该用户访问
的
页面类别。这种双
聚
类
技术将首先生成用户集群,然后生成页面clusters.after,它将用户集群和页面集群结合起来生成双集群。现在,我不知道应该使用哪种集群技术来实现此目的。最好
的
聚
类
将从该矩阵生成一致
的
双色图。
浏览 2
提问于2014-05-07
得票数 0
1
回答
如何在HMM matlab统计工具箱中定义发射矩阵
、
、
、
我是Matlab中图像处理
的
新手,现在我正在使用Matlab统计工具箱使用HMM进行字符识别。F=26 55 74 123 186 260 258 75 43 21在问这个问题之前,我已经看
浏览 1
提问于2013-02-18
得票数 1
回答已采纳
1
回答
有办法对一组多元高斯分布进行
聚
类
吗?
、
、
、
、
我有一组多元(2D)高斯分布(用均值和方差
表示
),并希望对这些分布进行
聚
类
,以保持概率高斯信息(也许使用方差
的
重叠?)。
浏览 2
提问于2016-09-24
得票数 1
回答已采纳
2
回答
使用
K
-均值
聚
类
生成锚盒
、
、
、
、
我试图了解YOLO
的
工作原理,以及它如何检测图像中
的
对象。我
的
问题是,
k
-均值
聚
类
在检测对象周围
的
边界框中起着什么作用?谢谢。
浏览 0
提问于2019-06-04
得票数 3
回答已采纳
1
回答
什么时候使用Word2vec和书包字?
、
、
我仍然不确定什么时候该使用word2vec,什么时候该依靠一袋袋
的
单词。例如,如果我想开发一个文本
聚
类
模型
,该
模型
将文本作为输入并为每个输入输出一个集群,我应该关心单词
表示
和使用word2vec,还是应该依赖单词包,并将输入文本作为文档处理?请与我分享更多
的
阅读和理解资源;我对文本预处理和
聚
类
非常感兴趣,并想了解我所能了解
的
一切。 此外,如果我想使用
k
-均值进行
聚
类</em
浏览 3
提问于2022-03-30
得票数 0
回答已采纳
2
回答
如何使用TensorFlow对某些文本进行
聚
类
、
对由于这一领域尚处于起步阶段而造成
的
任何不准确之处
表示
歉意。 我正在学习如何返回包含三个
类
的
dataset,这些
类
将由TensorFlow进行集群。在这个阶段,我读了很多书,并对几个Colabs进行了实验,但在文本(仅仅是分类)方面,它们都没有提到
聚
类
技术。问题是,我不知道文本如何分类,而且我认为TensorFlow使用
的
递归过程可以提供一个更好
的
方法和结果,说明我通常通过使用
K
-方法得到
的
结果。很
浏览 0
提问于2020-04-21
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
Spark平台下基于LDA的k-means算法实现
机器学习入门——基本概念(2)
聚类与K-Means
机器学习(三):K均值聚类
大数据聚类算法知多少?如何无需编程快速实践?算法干货
热门
标签
更多标签
云服务器
ICP备案
腾讯会议
云直播
对象存储
活动推荐
运营活动
广告
关闭
领券