腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
在这种情况下,
有
什么更好:
分类
还是
聚
类
?
、
我从不同的来源( FB、Twitter、Linkedin )收集
数据
,然后用结构化格式制作这些
数据
。因此,现在我
有
一个包含10000行(10000个人)的csv文件,相关的
数据
是关于他们的名字、年龄、兴趣
和
购买习惯。对于
聚
类
:我开始计算相似性
和
KMea
浏览 2
提问于2019-05-08
得票数 0
回答已采纳
1
回答
是否
有
处理
数值
属性的子空间
聚
类
方法?
、
、
、
、
我正在尝试对我的
数据
集(具有数字维度)应用一些
聚
类
方法。但我确信,对于不同的
聚
类
,这些特征具有不同的权重。我读到
有
一种称为软子空间
聚
类
的方法,它试图同时识别集群
和
每个集群的特征权重。然而,我发现的
算法
只适用于
分类
数据
。 我正在尝试找出一些软子空间
聚
类
算法
用于
数值
计算。您是否知道是否
有
任何方法,
浏览 14
提问于2018-02-03
得票数 0
1
回答
当
我们
有
数值
和
分类
数据
时
,
使用
哪种
算法
来
处理
聚
类
问题
?
、
、
、
、
我对集群几乎是个新手,对
使用
的方法有点困惑。我
有
一组建筑,我想根据它们的能耗、大小、类型
和
邻里关系对它们进行
聚
类
。我
使用
k-means方法
和
"get_dummies“方法来
处理
我的
分类
数据
。我想问,这是否
处理
分类
数据
的正确方法?(我还试图简单地将它们映射到1,2,3等数字,并在
聚
类
之前对它们进行归一化,但没有收到合适的
浏览 28
提问于2020-04-19
得票数 1
回答已采纳
1
回答
根据
数据
类型,最适合的机器学习
算法
是什么?
、
、
我是
数据
科学的初学者。我发现一些机器学习
算法
在给定特定类型的
数据
(即
数值
、
分类
、文本、图形)
时
表现得更好。我在网上搜索了这个话题,但没有运气。希望对这个
问题
的回答将有助于
数据
科学的初学者。 更新:如果您能够解释哪些类型的
数据
最适合下面的<
浏览 0
提问于2017-06-23
得票数 9
2
回答
用包含字符串的多列进行
聚
类
、
、
我
有
以下
数据
集:https://www.kaggle.com/carolzhangdc/imdb-5000-movie-datasetcountry objectavgRating float64因为列、国家和类型包含字符串,所以我不能
使用
浏览 0
提问于2019-04-02
得票数 2
回答已采纳
1
回答
聚
类
前的归一化
、
、
、
、
如果
我们
有
分类
数据
,而
分类
数据
是
使用
虚拟对象
和
标签编码转换为
数值
的,那么在
聚
类
之前是否必须对
数据
进行标准化?如果是,那么在这种情况下
使用
哪种
标准化技术最合适?
浏览 0
提问于2019-12-30
得票数 0
13
回答
混合
数值
和
分类
数据
的K-均值
聚
类
、
、
、
、
我的
数据
集包含许多数字属性
和
一个
分类
。我
使用
默认的八阶K均值
聚
类
算法
的实现。它只适用于数字
数据
。因此,我的
问题
是:将CategoricalAttr
分类
属性拆分为三个
数值
(二进制)变量(如IsCategoricalAttrValue1, IsCategoricalAttrValue2, IsCategoricalAttrValue3
浏览 0
提问于2014-05-14
得票数 200
回答已采纳
3
回答
R中丢失类别和
数值
的
聚
类
算法
、
、
、
我想在R中缺少
分类
和
数值
的
数据
集上执行营销细分
聚
类
。由于缺少值,我无法执行k-means
聚
类
。R版本3.1.0 (2014-04-10)Mac OSX 10.9.3 4 4GB硬件驱动器 在R中是否
有
一个
聚
类
算法
包可以适应部分填充速率查看关于缺失值的学术文章,研究人员为特殊用例创建了一个新的
算法
,这些包在R中
浏览 1
提问于2014-06-04
得票数 9
1
回答
ML模型的鲁棒性
、
、
、
在试图模拟类似于这论文中描述的ML模型
时
,经过一些调整后,我似乎最终在一些样本
数据
上获得了良好的
聚
类
结果。很高比例的观测结果被放入正确的
聚
类
中,表明模型确实起了作用。例如,如果
我们
有
属于簇$a$的观测$A$,以及属于簇$b$的观测$B$,则该模型可以输出用于观察$a$的(0.99, 0.01) (其中0.99表示属于$a$的概率较高,0.01表示属于$b$的概率较低(这些特定的数字是随机选择的,但通常良好的结果提供了接近0
和
1的概率。
浏览 0
提问于2018-09-07
得票数 10
1
回答
基于先前
聚
类
的集合预测新
数据
、
、
、
我
有
一个很大的二进制
数据
集需要
聚
类
。例如 [[0 1 1 0 ... 0 1 0 1 ], ...[0 0 1 0 ... 1 0 1 1 ]] 据我所知,最好的二进制
数据
聚
类
算法
是分层的,比如凝聚聚
类
。所以我
使用
scikit实现了这一点。然后,
当
一组新
数据
到达
时
,加载先前的集群并调用predict()以确定它将
浏览 15
提问于2019-05-04
得票数 0
2
回答
在Weka中
使用
聚
类
进行预测
、
、
、
、
我可以
使用
聚
类
(例如,
使用
k-均值)在Weka中进行预测吗?我在Weka中
使用
一些
分类
器(例如Bayes)进行预测。我的结果是基于这个答案(投票意向),我
有
大约60%的召回率(正确的预测率)。 我明白
聚
类
是另一回事,但是我能用
聚
浏览 3
提问于2013-04-28
得票数 2
回答已采纳
1
回答
由
分类
数据
和
连续
数据
组成的
数据
集的聚类分析?
、
R:无监督机器学习的聚类分析实用指南:第1卷(多元分析),Alboukadel Kassambara先生 然而,我遇到了一个
问题
,因为在这本书中,
数据
标准化取代了
数值
变量,然而,我
有
一个由13个变量组成的
数据
集,其中最主要的是
分类
。我查过google
和
一些堆叠溢出
问题
,我找不到一个明确的答案,比如如何
处理
分类
变量
和
连续变量组合的聚类分析。有些人提到层次
聚
类
,而有些
浏览 2
提问于2018-07-18
得票数 0
回答已采纳
2
回答
是否
有
一种
聚
类
算法
可以接受某些
聚
类
作为输入,并输出更多的
聚
类
?
、
、
、
、
以下是我的任务:我
有
我不太了解的
数据
。最后的任务是建立一个
分类
器,将样本
分类
为几个类别。有些
分类
非常清楚,
我们
可以很容易地将它们用作
分类
器的标签。由于我不是在特定领域的专家,我想
使用
一些
聚
类
算法
来
显示可能的标签想法。
当
使用
传统的
聚
类
算法
时
,它们会在我不感兴趣的
数据</
浏览 0
提问于2020-10-30
得票数 3
3
回答
无监督
数据
的
分类
技术?
、
、
我有无监督的
数据
(即,这些
数据
没有任何目标变量,我可以通过它来了解它的先前行为),它是连续
数据
和
分类
数据
的混合体。现在,我想根据我的非监督
数据
将测试
数据
分为三
类
。我采取的方法是首先对无监督的
数据
进行
聚
类
,
使用
这些
分类
数据
作为基础
数据
,准备一个新的模型,在此基础上进行预测。 我想知道这种方法是否正确,还是
浏览 0
提问于2016-06-14
得票数 5
1
回答
推荐/
聚
类
数据
以支持假设。这是无监督ML的有效用例吗?
、
、
我
有
一个
数据
集,其中一些项已经被标记(
分类
为4个
类
、B、C、D)。然而,绝大多数
数据
集都没有贴上标签。我的假设是,
有
一些特征会影响每个项目的应用类别。
聚
类
或者甚至推荐系统都能建议每个项目应该放在哪里吗?在实际层面上,我会否在模型内提供“标签”?或者,我会把它分开直到结束,然后覆盖这些标签在任何模型设法组合在一起? 上面的例子似乎是一个集群用例。但是,我能否把这个
问题
转化为推荐系统呢?你把X标记为A,它有特征1,2,3.项目Y
有
浏览 0
提问于2020-12-29
得票数 2
回答已采纳
2
回答
选择
哪种
机器学习
算法
?
、
、
我想选择一个无监督的
算法
来
学习从
数据
中预测$n$输出,例如。图像中的4个坐标(像素)。我应该选择
哪种
算法
?我认为将图像中的点的集合划分为输出(1)或不属于(0)是一种2
类
分类
,可能是logistic回归,给出一个点作为输出点的概率。但我很困惑,因为
分类
算法
是
有
监督的
算法
的一部分,
我们
有
标签的
数据
。我是否应该
使用
聚</em
浏览 0
提问于2018-05-25
得票数 2
2
回答
如何
处理
NaN值,
当
计算没有意义
时
?(适用于常设仲裁院)
、
、
、
我很难弄清楚如何
处理
NaN变量,在这些变量中,
数据
归责是没有意义的。我正在尝试进行文本/文档
聚
类
,有些缺失的值需要保持丢失,因为没有合理的方法
来
填充它们。我的
数据
集包含了一些
数值
、日期、文本等。实际上,的在副标题“
当
计算没有意义
时
考虑坐姿”是我
问题
的一个很好的例子。在矢量化之后,我需要执行PCA
来
降低维数,这样我就可以在没有内存错误的情况下
处理
大
数据
,并
浏览 0
提问于2019-04-03
得票数 4
回答已采纳
1
回答
基于GPS
数据
的人群驾驶组合
、
、
我需要根据GPS
数据
把开车的人聚在一起。
数据
由移动电话收集。
我们
每10秒就从每个用户那里分批接收它们。每批的GPS
数据
(位置、速度、方向)每2秒收集一次。理想的解决方案是实时
处理
这些
数据
,并识别/更新一起开车的人群。但是,
我们
可能会从用户那里收到无序的
数据
(例如,由于连接性的丧失)。最终,
我们
应该得到所有的条目,但这使得实时
处理
更加复杂。相反,我想先从后
处理
开始。我计划
使用</em
浏览 0
提问于2022-10-23
得票数 1
2
回答
我应该
使用
哪种
集群技术?
、
我
有
一个
数据
矩阵,如下所示。 user access matrix..each行代表用户,每一列代表该用户访问的页面类别。这种双
聚
类
技术将首先生成用户集群,然后生成页面clusters.after,它将用户集群
和
页面集群结合起来生成双集群。现在,我不知道应该
使用
哪种
集群技术
来
实现此目的。最好的
聚
类
将从该矩阵生成一致的双色图。
浏览 2
提问于2014-05-07
得票数 0
1
回答
如何在混合
数据
集中
使用
聚
类
算法
来
减少维数?
、
、
、
、
我正在
使用
与电视消费
数据
相对应的混合
数据
集,目的是将特征的数量减少到仅用于
使用
聚
类
检测电视消费模式(或消费组)的特征数。 该
数据
集由约20个维度
和
2.000.000个样本组成,供1天
使用
。3维为连续/
数值
型(消费日期、持续时间.)其余维度为离散/
分类
类型,具有二进制选项(例如,方案是否是活的)或多个甚至数百个选项(例如节目名称、主题、设备类型等)。因此,我试图用Python实现一
浏览 0
提问于2021-05-03
得票数 2
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
算法茫茫,何去何从?
如何正确使用“K均值聚类”?
选择最佳机器学习模型的10步指南
scikit-learn系列之第五篇:分类算法筛查
用Python进行无监督学习的几种最热门的聚类算法
热门
标签
更多标签
云服务器
ICP备案
腾讯会议
云直播
对象存储
活动推荐
运营活动
广告
关闭
领券