腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(879)
视频
沙龙
1
回答
如何从使用Python
的
数据集中
的
预定义集群中找到最远
的
数
据点
?
、
我有一个数据集,其中某些行被标
记为
一个
类
(并将其解释为不同
的
集群#1 ),但其他点要么没有标记,要么不明确。因此,我想通过将未标记数
据点
与集群#1
的
各自距离(更准确地说,从集群#1
的
最近点到相应
的
未标记点)排序,找出哪些未标记
的
数
据点
与集群#1
相
距最远。我
的
第一个想法是在这些点之间建立一个相似矩阵,并计算出每个未标记点
的
最近距离,但不知怎么说,这似乎是
一种
笨拙<e
浏览 0
提问于2020-07-30
得票数 1
2
回答
有没有
一种
有效
的
方法来
聚
类
标
记为
相
似的
数
据点
?
、
、
、
, 4] || 5 | [5] |我想对相
似的
图像进行
聚
类
我
的
目标是这样做:| ------| -------------- |-------|| 5 | [5] | 3
浏览 13
提问于2021-05-16
得票数 3
1
回答
在Python中利用k均值
聚
类
检测异常
、
、
、
、
我正在处理Python中
的
异常检测任务。 为了发现异常,我使用k均值
聚
类
算法。训练是利用数据集中
的
训练部分进行
的
,预测是一天一天进行
的
。 为了区分记录是否异常,我计算每个点与其最近
的
质心之间
的
距离。number_of_outliers).min() day_df['anomaly'] =
浏览 0
提问于2019-07-29
得票数 3
1
回答
K-modes集群演化
在使用k-mode对数据集执行
聚
类
之后,我必须及时演化
聚
类
,那么,是否有
一种
方法可以在数
据点
更改其属性值时自动调整质心? 我是说。我正在对一大组具有类别值
的
数据进行
聚
类
。然而,这些数
据点
会随时间变化(它
的
分类值),所以我想知道,只要数
据点
随着时间
的
推移略有变化,是否有任何方法可以调整K个质心(甚至K个数)。我可以用质心重新计算每个数
据点
之间<em
浏览 0
提问于2018-04-30
得票数 0
1
回答
为数
据点
找到集群
的
简单方法是什么?
、
我知道,在无监督
的
机器学习中,有很多方法可以找到
聚
类
。然而,我想要
一种
简单易懂
的
方式,而不是不可预测
的
。而且,我
的
数
据点
很少。数
据点
的
数
=大约20个,只有,最大
的
cluster= 4,,,集群中数
据点
的
数目可以改
浏览 0
提问于2021-07-19
得票数 0
1
回答
如何使用tSNE和kmeans质心找到质心对应
的
原始数
据点
?
、
、
我使用t-SNE将我
的
数据集
的
维
数
从18降到2,然后使用kmeans对2D数
据点
进行
聚
类
。使用这个,print(kmeans.cluster_centers_)我现在有了一个集群
的
2D质心数组,但我想要获得这些质心对应
的
18D原始数
据点
。
有没有
一种
方法可以倒着使用t-SNE?谢谢!
浏览 51
提问于2021-07-25
得票数 0
回答已采纳
1
回答
如何组合分布相
似的
数据?
、
、
、
、
我收集
的
时间序列数据与数
据点
约2年
的
每日数据。我想出
一种
方法来
增加数
据点
的
数量,这样神经网络就能更好地理解数据
的
波动。我提出了一个假设,我试图按照相
似的
分布对相
似的
时间序列数据进行
聚
类
,以增加输入到神经网络
的
数
据点
的
数量。这是解决问题
的
正确方法吗?如果是这样的话,我在什么基础上将这些相
似的
数据
浏览 0
提问于2019-08-31
得票数 2
2
回答
一种
自定义聚集算法
的
从头实现
、
、
、
、
我了解聚
类
算法,它从每个数
据点
开始作为单独
的
聚
类
,然后将点组合成簇。 集群两点c1和c2如果簇之间跨越维度1
的
距离为< T1,而跨维度2
的
距离< T2,则.和跨越维
数
n< Tn
的
距离。如果满足了跨维度1
的
规
浏览 4
提问于2012-05-27
得票数 6
回答已采纳
1
回答
ML模型
的
鲁棒性
、
、
、
在试图模拟类似于这论文中描述
的
ML模型时,经过一些调整后,我似乎最终在一些样本数据上获得了良好
的
聚
类
结果。“好
的
”结果,我
的
意思是很高比例
的
观测结果被放入正确
的
聚
类
中,表明模型确实起了作用。(这些特定
的
数字是随机选择
的
,但通常良好<
浏览 0
提问于2018-09-07
得票数 10
2
回答
过滤和修改循环中
的
不可变序列,并在后续
的
筛选调用中进行
有效
的
更改
、
我想我杀了这个头衔,但我不能用另
一种
方式来表达。另
一种
选择是使整个可折叠
的
事物可变,并在集合中修改实例。我
有没有
其他
的
选择,而不使这些(
类
和集合)变?在这种情况下,我甚至不知道如何同时修改和过滤。 我想我应该多解释一下我
的
情况。具体来说,我正在尝试实现dbscan
聚
类
算法。我有一个函数,可以返回两个数
据点
之间
的
距离。对于每一个数
据点
,我需要得到比那个数
据点
更接近<
浏览 7
提问于2015-10-11
得票数 0
回答已采纳
1
回答
聚
类
循环Python
我正在使用kmeans对python中
的
数据集进行
聚
类
。在对数据集进行
聚
类
之前,我使用肘形曲线确定了最佳
聚
类
数
。 最优
聚
类
数
为5。因此,在对数据集进行kmeans
聚
类
之后,我得到了5个不同
的
聚
类
。这是我
的
问题。现在我有了5个不同
的
集群,我想再次对这5个集群进行集群,这样我就可
浏览 1
提问于2022-01-31
得票数 0
回答已采纳
2
回答
用Python将偶然性矩阵转换为1D格式
、
、
、
2x2应急矩阵: 2 1 1 0[[ 0 0 0 1 ]应变矩阵表示两个
聚
类
算法
的
结果,每个
聚
类
算法有两个
聚
类
。第一行表示Ci在集群1中有三个数
据点
,在集群2中有一个数
据点
。Cj在集群A中有三个数
据点
,在集群B中有一个数
据点
。因此,这两种算法都“同意”N=4个数
据点
中
的
两个数<em
浏览 7
提问于2022-07-20
得票数 1
回答已采纳
1
回答
如何计算
聚
类
量化误差?
、
、
我想用量化误差来衡量
聚
类
的
质量,但是找不到任何关于如何计算这个度量
的
明确信息。我发现
的
少数文件/文章如下: 在2011年发布了关于不同类型距离测量
的
交叉验证(这个问题非常具体,没有给出多少关于计算
的
内容)。,其中quantization_error函数(在代码
的
末尾)是用Python实现
的
。关于第三个链接(这是我迄今为止找到<em
浏览 4
提问于2018-01-10
得票数 4
回答已采纳
1
回答
特征选择、
聚
类
、降维算法
的
区别
、
、
、
有人能指出特征选择和
聚
类
以及降维算法之间
的
区别吗?
聚
类
帮助我们指出哪些变量簇清楚地定义了输出。特征选择+
聚
类
不是和降维算法一样吗?
浏览 4
提问于2015-10-27
得票数 0
1
回答
如何在SPSS中解释k-means
的
输出
、
、
、
、
我可以使用什么标准来说明我选择
的
最终
聚
类
的
数量。使用层次聚类分析,我在K均值分析中从2个
聚
类
开始。然而,在运行了许多其他具有不同聚
类
数
的
k-means之后,我不知道如何选择哪个更好。
有没有
一种
通用
的
方法来
选择科学上正确
的
集群数量。
浏览 4
提问于2014-12-16
得票数 0
1
回答
选择簇
数
的
好指标是什么,以使所得到
的
簇是均匀
的
?
、
我在一维数据集上执行
聚
类
,我需要
一种
方法来
自动确定来自k \in \{2, 3, 4, 5, 6\}
的
最佳集群
数
。对
聚
类
的
观测
数
较少(通常在10-13之间)。我想我需要检查两个目标之一
的
优化(或者同时进行),看看什么是最
有效
的
: 若要使用群集内差异最小
的
分区实现分区,请执行以下操作。从直觉上讲,我会选择类似于簇内平均方差
的
方法,
浏览 0
提问于2019-12-27
得票数 2
1
回答
如何比较聚类分析中
的
标签和原始标签?
、
、
、
、
我被要求进行聚类分析,以评估手动标记数据集
的
标签
的
有效
性。问题是,“
聚
类
标签”具有由
聚
类
算法分配
的
任意值,例如,所有标<e
浏览 0
提问于2023-02-08
得票数 0
1
回答
从产品照片中剥离背景
的
机器学习模型是可行
的
?
、
我
的
目标是能够通过模型处理产品照片,并让它在白色背景下返回与产品相同
的
照片。产品照片将有不同
的
大小和产品类型。 我想提供有背景和没有背景
的
产品
的
模型照片。在未来,我也将扩展数据集与部分删除
的
背景。
浏览 2
提问于2016-06-23
得票数 0
回答已采纳
2
回答
层次
聚
类
、
我已经阅读了一些参考资料,并了解了层次
聚
类
的
工作原理。然而,当我将其与k-means
聚
类
进行比较时,在我看来,k-means确实构成了特定数量
的
聚
类
,而层次分析则向我展示了如何对样本进行
聚
类
。我
的
意思是,在分层
聚
类
中,我没有获得特定数量
的
集群。我只得到了一个关于集群如何构成
的
方案,以及样本之间
的
部分关系。 因此
浏览 4
提问于2018-04-24
得票数 1
2
回答
有效
动态
聚
类
、
、
、
、
我有一组来自单元间隔
的
数
据点
(即具有数值
的
一维数据集)。我在网上收到了一些额外
的
数
据点
,而且某些数
据点
的
值可能会动态变化。我正在寻找一个理想
的
聚
类
算法,它可以
有效
地处理这些问题。我对使用k均值算法
的
关注是,需要提供簇
数
作为输入。我知道它们优于其他
聚
类
算法(GAs、MSTs、分层方法等)。时间和空间
的
复杂性。老实
浏览 5
提问于2014-07-08
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
热门
标签
更多标签
云服务器
ICP备案
云直播
对象存储
实时音视频
活动推荐
运营活动
广告
关闭
领券