腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(4065)
视频
沙龙
1
回答
K
聚
类
来自
Panda
Dataframe
而
不是
样本
数据
python
、
pandas
、
jupyter-notebook
、
cluster-analysis
Panda
有12列,一列是“时间戳”,然后是11列,其中包含不同国家的
数据
。 我想要做的是将它们可视化到一个集群中。我找到了以下代码来创建一个基本的集群。但我已经努力了一段时间,才能对我的
数据
做与下面完全相同的事情。有人知道我需要做些什么才能用我的熊猫
数据
替换随机
样本
数据
吗?
浏览 14
提问于2020-11-05
得票数 0
回答已采纳
1
回答
在R中使用
k
-means的结果
r
、
cluster-analysis
、
k-means
我使用R的kmeans指令在
数据
集中执行
k
-means算法。我有一个关于我去的一些参数的问题。
浏览 2
提问于2013-01-25
得票数 5
回答已采纳
2
回答
如果我的全部训练文件都是A
类
,我如何使用TF-国防军找到A
类
的其他文件?
python
、
machine-learning
、
tf-idf
、
text-classification
我收集了X个文档,所有这些文档都属于A
类
(是我感兴趣或了解的唯一
类
)。我也有一个更大的收集Y文件,我不知道。X和Y中的文档来源相同,格式相似,主题也有些相似。我想使用X中文档的TF-国防军特征向量来查找Y中最有可能属于A
类
的文档。在过去,我使用TF-国防军特征向量来构建朴素的Bayes分类器,但在这些情况下,我的训练集X由许多
类
的文档组成,我的目标是将Y中的每个文档归类为X中所见的
类
之一。 这似乎是另一种情况。在这里,我的整个培训集都有相同的
类
(我没有我知道的不属于A
类
浏览 5
提问于2015-09-13
得票数 1
回答已采纳
2
回答
标杆EM软
聚
类
对
K
-均值?
cluster-analysis
、
benchmarking
、
k-means
、
data-mining
、
expectation-maximization
我有两种实现,一种是
K
-均值,另一种是EM进行软
聚
类
。但我不知道如何验证它们的准确性。也就是说,通过检索更好的集群,哪一个表现得更好。我的假设是,因为EM做的是软赋值,
而
不是
K
-均值中的硬赋值。如何衡量EM软
聚
类
对
K
-均值的准确性?对合成
数据
也有什么建议吗?
浏览 14
提问于2014-07-21
得票数 0
回答已采纳
1
回答
如何将使用
k
-medoids算法的
聚
类
解决方案(例如PAM)应用于另一个
数据
集?
cluster-analysis
我正在寻找一种方法,将
k
- medoids算法(我正在使用PAM)中的
聚
类
解决方案从一个
样本
应用到另一个
样本
。我认为
k
-means算法可以做到这一点:对于data1,从
聚
类
结果中获得质心;然后在data2中,对于每个观察值,计算到每个质心的距离,然后将每个观察值分配到其最近的质心。然而,
k
- medoids算法(例如PAM)使用medoids作为
聚
类
中心,
而
不是
均
浏览 30
提问于2020-02-12
得票数 2
回答已采纳
1
回答
有太多类别的
数据
python
、
r
我希望在做
数据
工程的时候知道一种通用的方法。 我有一个
数据
集,有些变量包含太多的类别,将这些变量包含到一个预测模型中肯定会增加模型的复杂性,从而导致过度匹配。
浏览 2
提问于2018-05-09
得票数 0
2
回答
如何将机器学习分类方法应用于一维时间序列
数据
python
、
machine-learning
、
classification
我有IMU
数据
(加速计、磁力计和陀螺仪),在不同的练习中(下沉、俯卧撑、仰卧起坐、穿孔)。这些练习是在单个1D时间序列信号中完成的,我想使用机器学习分类方法来识别信号中的不同练习。下图显示了包含四个练习的加速度计的示例
数据
。因此,我的问题是,在这样做时,哪种方法最有效?
K
-means
聚
类
在0D意义上是完美的,那么有1D等价吗?
浏览 2
提问于2018-05-25
得票数 2
1
回答
通过
聚
类
选择
样本
clustering
、
scikit-learn
、
sampling
我有一个偏倚的
样本
集进入二值分类滑雪板流水线,白色和黑色的
样本
。特征集(在完全不变特征之后)约为28
k
特征。 我想出的最好的方法是把我的黑色
样本
聚
成一个百分比的白色
样本
。例如,假设我有500
k
白色
样本
,然后将黑色
浏览 0
提问于2016-10-24
得票数 1
2
回答
处理
K
-意味着使用大
数据
集6gb与scikit学习?
python
、
scikit-learn
我想对6gb的文档
数据
集进行集群,并找到文档集群。谢谢,如果你有什么问题请告诉我。
浏览 6
提问于2014-02-03
得票数 1
回答已采纳
2
回答
为什么Silhouette_score需要标签作为输入?
machine-learning
、
cluster-analysis
为什么认为它只需要
数据
是错误的,因为它:“输出一个对象与它自己的集群(内聚力)与其他集群(分离)相比有多相似的度量。” 但是,我还需要输入标签(由函数自己计算);那么,为什么必须输入标签呢?
浏览 2
提问于2020-03-09
得票数 0
1
回答
自组织映射“错误”
k-means
、
som
正如我们从
K
-Means知道的那样,在
样本
数据
被
聚
类
到N个集群(每个集群有一个质心向量)之后,并
不是
所有的
数据
都被聚在它们所属的集群中!我的意思是,一些
数据
向量可能被聚集在错误的集群中。这意味着即使在
K
-意味着在
聚
类
时也
不是
100%的精度。我想知道这样的“错误”是否也发生在SOM算法中。So...after自组织映射算法收敛是否存在不属于实际放置的节点的
数据
<em
浏览 2
提问于2013-03-19
得票数 0
2
回答
K
均值算法中n_clusters的最大值
python
、
machine-learning
、
nlp
、
cluster-analysis
、
k-means
我有一个有28000条记录的
数据
集。
数据
是一个电子商务商店的菜单项.所面临的挑战如下: 多家商店有相似的产品,但名称不同。
浏览 0
提问于2021-01-20
得票数 0
1
回答
X秒采样间隔不均匀
python
、
time-series
、
clustering
、
predictive-modeling
我有以下规范的
数据
集:每个
样本
是
来自
传感器的8秒
数据
,分辨率为4ms。例如,我在第一天采集了5个
样本
,然后在第5天采集了10个以上的
样本
等等。我想要对
数据
进行
聚
类
,以检查是否可以从单个8秒的
样本
中推断出机器的操作模式。此外,我还想衡量一年来组件的性能,以便进行预测维护。 目前,我想使用自组织映射进行
聚
类
。我是
浏览 0
提问于2021-04-29
得票数 0
回答已采纳
2
回答
如何在SciKit学习Python中识别KNN模型中每个集群中的记录?
python
、
scikit-learn
、
label
、
knn
目标变量分为2
类
,其特征为3个分类变量(国家、语言和公司)。这个模型说最优的是5个簇,所以我用5来做。我试过了:预测=knn.predict(特性) 但这只是返回目标变量的两个标签的估计值。
浏览 0
提问于2019-08-09
得票数 0
回答已采纳
2
回答
如何在集群上应用集群?
r
、
cluster-computing
、
cluster-analysis
、
igraph
我使用R library(igraph)对我的
数据
集进行
聚
类
。我有几个连接的组件,但第一个非常大,这是巨大的组件。我想在这个巨大的组件上重新应用集群,以便重新构建集群。这样做有意义吗?
浏览 4
提问于2019-06-06
得票数 0
1
回答
K
-均值
聚
类
与R
r
、
k-means
我试图在R中使用
K
均值
聚
类
来
聚
类
一些
数据
。要
聚
类
的
数据
是
来自
tweet
样本
的一组特定特性。这些tweet被标记为x或y。下面显示了一个
数据
示例,删除了用户名和ID,这些字段不用于集群。 总共有246
k
个
数据
项,其中约17
k
标记为y,其余标记为x。在
聚
类
之后,我预计会出现两个集群,每个集
浏览 0
提问于2017-07-05
得票数 1
1
回答
K
-means
聚
类
不是
围绕质心进行分组
python
、
pandas
、
k-means
我正在尝试使用sklearn.cluster KMEANS模块运行
K
-means
聚
类
,但我没有从
聚
类
中获得预期的结果。 我正在处理的
数据
集是一个64x6830的基因组
数据
矩阵。我标准化了
数据
,使标准差为1,平均值为0。在
dataframe
中,
数据
如下所示: 0 1 2 3 4 5 \ Cance
浏览 19
提问于2021-10-04
得票数 0
回答已采纳
1
回答
从
聚
类
获得的标注在视觉上看起来不正确
python
、
machine-learning
、
scikit-learn
、
cluster-analysis
、
unsupervised-learning
我有以下基于10个
数据
点的距离矩阵:我将distance_matrix转换为热图,以便更好地查看
数据
import seaborn as snsdistance_matrix_df.columnsclusters =
浏览 3
提问于2020-10-24
得票数 1
1
回答
当选择远离
数据
的初始质心位置时,
K
-意味着如何工作?
python
、
machine-learning
、
scikit-learn
、
cluster-analysis
、
k-means
根据我对
K
-均值
聚
类
的理解,
k
被选择,质心位置被选择,
样本
被分配,然后质心移动到
样本
的平均值,直到没有更多的运动。 我期望所有的
样本
都分配给(5,1)质心,然后移动到
数据
的平均值(5,0),算法将结束于属于一个
聚
类
的所有
样本
(其他质心不移动,并且有一次迭代)。.: data = pd.
DataFrame
({"Xa": xa, "Xb"
浏览 13
提问于2022-01-11
得票数 2
1
回答
如果培训和测试
数据
集
来自
同一源,怎么办?
machine-learning
、
svm
、
training
将
k
均值
聚
类
和支持向量机算法相结合,结合10倍交叉验证,可达到95%的准确率。所有的训练和验证
数据
集都
来自
于实验。在测试中,我是否可以在同一个
样本
重复相同的实验后获得
数据
集,或者我必须使用不同的
样本
集?
浏览 0
提问于2021-05-02
得票数 0
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
Python之K均值聚类
人工智能机器学习常用算法总结及各个常用算法精确率对比
在 FIFA 20 将技能相似球员进行分组(1):K-均值聚类
机器学习——K-均值算法理论
人工智能–K-Means算法
热门
标签
更多标签
云服务器
即时通信 IM
ICP备案
对象存储
实时音视频
活动推荐
运营活动
广告
关闭
领券