腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
同时
使用
分类
数据
和
连续
数据
进行
聚
类
r
、
cluster-analysis
我正在尝试创建一个将
分类
数据
和
连续
数据
结合在一起的无监督模型。我想我已经算出来了,但这是正确的方法吗?加载库 library(tidyr)library(fastDummies)library(dplyr) 创建样本
数据
集 set.seedincome = rnorm(10, 40, 10), volume = rnorm(50, 40, 100)) 创建稀疏矩阵
和<
浏览 43
提问于2019-03-01
得票数 0
3
回答
如何对(k-均值)
聚
类
模型中的某些特征给予更高的重视程度?
machine-learning
、
clustering
、
feature-scaling
、
dummy-variables
我用数字
和
分类
变量对
数据
进行
聚
类
。为了处理集群模型的
分类
变量,我创建了虚拟变量。然而,我觉得这会对这些虚拟变量产生更高的重要性,因为多个虚拟变量代表一个范畴变量。例如,我有一个
分类
变量Airport,它将导致多个虚拟变量: LAX、JFK、MIA
和
BOS。现在假设我也有一个数值温度变量。现在,我的机场变量似乎是温度变量的4倍,集群主要是基于机场变量。我想用一种不同的方式来缩放变量,但我不知道如何对它们
进行
缩放,以使它
浏览 0
提问于2019-04-16
得票数 6
回答已采纳
2
回答
在
聚
类
中预测
r
、
cluster-analysis
在R语言中,有没有像我们在
分类
中那样的
聚
类
预测功能?除了比较两个集群之外,我们可以从R得到的
聚
类
图结果中得出什么结论?
浏览 2
提问于2011-11-13
得票数 2
2
回答
聚
类
的
分类
特征预处理
clustering
、
preprocessing
、
categorical-data
、
feature-scaling
、
feature-construction
有人能告诉我们用混合特性(包括
分类
特性
和
连续
特性)来
聚
类
数据
的最佳实践吗?我正在努力解决一个问题;我意识到,对于所有度量算法,在集群之前必须对
连续
数据
进行
缩放,所以我
使用
了sklearn.preprocessing.StandardScaler()。在我的
分类
特性中,我
使用
了一个编码器转换,但还不清楚是否有必要将这些一个编码向量的组件缩放到整个
数据
集,还是就这样保
浏览 0
提问于2019-09-18
得票数 2
1
回答
K-均值
聚
类
对
使用
PCA
和
原始
数据
减少的
数据
有什么不同吗?
machine-learning
、
python
、
data-mining
、
clustering
、
unsupervised-learning
我正在做
聚
类
工作,我有90个特征,有13500个
数据
点,去除了相关变量,其中皮尔逊相关性超过90%,我的特征空间减少到70个。而且,几乎所有我最初的90个特性都有大量的零值(超过70%-80%的
数据
点)。我在算法实现方面所做的是:K-表示pca减少的
数据
提供了更好的
聚
类
。有什么办法可以让我用这个集群来解释吗
浏览 0
提问于2020-01-21
得票数 3
1
回答
最佳k值的剪影评分(python中的k原型)
python
、
clustering
我试图
使用
k原型算法
进行
聚
类
,因为我的
数据
有
分类
变量
和
连续
变量。我找到了这个用k原型https://stackoverflow.com/a/56218269/9543171解释肘部方法的答案 如何
使用
剪影评分而不是成本来寻找k原型中的最佳k值?
浏览 0
提问于2021-10-10
得票数 0
回答已采纳
3
回答
无监督
数据
的
分类
技术?
machine-learning
、
r
、
unsupervised-learning
我有无监督的
数据
(即,这些
数据
没有任何目标变量,我可以通过它来了解它的先前行为),它是
连续
数据
和
分类
数据
的混合体。现在,我想根据我的非监督
数据
将测试
数据
分为三
类
。我采取的方法是首先对无监督的
数据
进行
聚
类
,
使用
这些
分类
数据
作为基础
数据
,准备一个新的模型,在此基础上
进行<
浏览 0
提问于2016-06-14
得票数 5
2
回答
机器学习中的无监督
分类
machine-learning
、
classification
、
unsupervised-learning
聚
类
(例如:K-均值,EM算法等)是利用
数据
点之间的距离度量,在
数据
集中形成
聚
类
,用于无监督
分类
。编辑:是的,我的意思是k-意思。
浏览 6
提问于2020-11-21
得票数 0
回答已采纳
2
回答
聚
类
前对混合
数据
进行
预处理
clustering
、
unsupervised-learning
、
preprocessing
我对分层
聚
类
很陌生,并希望对混合
数据
执行
聚
类
。对于必要的预处理步骤,我有点困惑.我知道如何预处理纯
连续
的
数据
,我还不能确定的是,对于混合
数据
来说,预处理步骤是必需的?我是否只是缩放我的
连续
变量,计算丢失的
数据
,而不去处理
分类
变量?还是需要对所有变量类型执行转换?
浏览 0
提问于2020-03-12
得票数 2
回答已采纳
1
回答
使用
python对混合
数据
进行
聚
类
python
、
cluster-analysis
我正在尝试
使用
基于Huang,Z.的k_prototype
聚
类
对包含混合
数据
(标称
和
有序)的
数据
集
进行
聚
类
:对具有混合数值
和
分类
值的大型
数据
集
进行
聚
类
。我的问题是如何找到最佳的集群数量?
浏览 10
提问于2019-05-16
得票数 0
2
回答
如果我将数值属性
和
范畴属性分开
聚
类
,这是错误的吗?
clustering
我有一个信用客户
数据
集,包含混合
数据
类型(数字
和
分类
有几个级别)。我试图执行分段,这样我就可以得到k组,然后构建定义(基于我拥有的属性)。虽然有关于混合
数据
类型(K-原型、Gower距离的层次
聚
类
)的
数据
聚
类
的解决方案,但为什么将数值属性
和
分类
属性分开并单独提出定义是错误的呢?
浏览 0
提问于2019-03-18
得票数 2
回答已采纳
13
回答
混合数值
和
分类
数据
的K-均值
聚
类
data-mining
、
clustering
、
octave
、
k-means
、
categorical-data
我的
数据
集包含许多数字属性
和
一个
分类
。我
使用
默认的八阶K均值
聚
类
算法的实现。它只适用于数字
数据
。因此,我的问题是:将CategoricalAttr
分类
属性拆分为三个数值(二进制)变量(如IsCategoricalAttrValue1, IsCategoricalAttrValue2, IsCategoricalAttrValue3
浏览 0
提问于2014-05-14
得票数 200
回答已采纳
2
回答
群集模型,如DBSCAAN、OPTICS、KMEANS
machine-learning
、
statistics
、
data-science
、
analytics
我怀疑在
使用
任何算法
进行
聚
类
后,是否可以根据从先前
数据
中学习的结果来分割新
数据
浏览 9
提问于2020-03-05
得票数 2
回答已采纳
1
回答
最佳实践XAI:理解构建集群的特性并解释底层结构
python
、
descriptive-statistics
、
explainable-ai
我希望对
数据
进行
聚
类
,并显示用于定义集群以显示
数据
中的结构的特性。 为了解释用例:成像,我有来自许多产品的
数据
,我想显示
数据
中的变化
和
结构。作为输入特性,我有一个BERT嵌入(在产品描述的帮助下创建)
和
其他
分类
和数字
数据
,作为价格,生产国,.到目前为止,我很难找到一种合适的方法,因为大多数方法都无法对
数据
进行
聚
类
(无监督),也无
浏览 0
提问于2023-05-05
得票数 0
回答已采纳
1
回答
当
使用
层次
聚
类
时,橙色是否从范畴变量转化为虚拟变量?
clustering
、
orange
我正在
使用
Orange对包含三个属性的大量
数据
进行
聚
类
。每个属性只包含
分类
无序变量。我的问题是,当在这样的
数据
集中
使用
距离
和
分层
聚
类
小部件时,Orange是否将
分类
变量转换为虚拟变量?
浏览 0
提问于2019-05-15
得票数 1
1
回答
我需要帮助
使用
哪些特性来
进行
集群。
clustering
、
k-means
、
pca
、
dbscan
我正在
使用
这个
数据
集:https://www.kaggle.com/datasets/sobhanmoosavi/us-accidents 到目前为止,我已经成功地清理了
数据
集,并减少了功能
和
记录的大小我有一些数字的特点,我已经标准化,还有一些
分类
的特点,我还没有触及。现在我需要
使用
Kmeans/Dbscan等来执行
聚
类
,并比较它们的结果。我读到,由于有很多特性(38),我可以对数值特征执行P
浏览 0
提问于2022-06-18
得票数 2
2
回答
用于
聚
类
的混合
数据
类型
clustering
我有以下类型的
聚
类
数据
-数字
数据
、
分类
数据
和
经度
数据
,用于python中一个
数据
的位置。当
数据
混合到这个程度时,我想知道如何
进行
聚
类
。是否可以
使用
DBSCAN或分层群集,以及需要做什么才能将
分类
数据
转换为数字。地理位置
数据
也是如此。
浏览 0
提问于2019-02-15
得票数 0
2
回答
如何将机器学习
分类
方法应用于一维时间序列
数据
python
、
machine-learning
、
classification
我有IMU
数据
(加速计、磁力计
和
陀螺仪),在不同的练习中(下沉、俯卧撑、仰卧起坐、穿孔)。这些练习是在单个1D时间序列信号中完成的,我想
使用
机器学习
分类
方法来识别信号中的不同练习。下图显示了包含四个练习的加速度计的示例
数据
。因此,我的问题是,在这样做时,哪种方法最有效?K-means
聚
类
在0D意义上是完美的,那么有1D等价吗?
浏览 2
提问于2018-05-25
得票数 2
1
回答
基于另一个变量或一组变量对变量
进行
聚
类
machine-learning
、
python
、
clustering
、
algorithms
df11[['COMPONENT_ID','FIRMWARE','SERIAL','CRP0_VDDN']].head()考虑到我有这四栏要分析。我想用相似的字符组成3-5簇的COMPONENT_IDs .我希望基于剩余的特性或与COMPONENT_IDs相关的COMPONENT_IDs实现这一目标。我该怎么做?
浏览 0
提问于2020-03-19
得票数 0
1
回答
是否有处理数值属性的子空间
聚
类
方法?
machine-learning
、
statistics
、
artificial-intelligence
、
cluster-analysis
、
unsupervised-learning
我正在尝试对我的
数据
集(具有数字维度)应用一些
聚
类
方法。但我确信,对于不同的
聚
类
,这些特征具有不同的权重。我读到有一种称为软子空间
聚
类
的方法,它试图
同时
识别集群
和
每个集群的特征权重。然而,我发现的算法只适用于
分类
数据
。 我正在尝试找出一些软子空间
聚
类
算法用于数值计算。您是否知道是否有任何方法,或者我如何调整最初设计用于处理
分类
数据</em
浏览 14
提问于2018-02-03
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
分类和聚类——1.从鸢尾花数据集与KNN说起
ML:教你聚类并构建学习模型处理数据
无人驾驶中的应用中都有哪些机器学习算法
40个问题测试你的机器学习聚类技术
自动驾驶中常用的四类机器学习算法
热门
标签
更多标签
活动推荐
运营活动
广告
关闭
领券