分类数据和数值数据的混合pyplot_将数值和分类数据混合到具有密集层的keras序列模型中_混合内置Python数值类型和Numpy标量数值数据类型的计算性能 - 腾讯云开发者社区

python

我正在看Kaggle中的泰坦尼克号的例子，我只是想问一下关于Python的事情--我到处寻找这个东西，但我似乎什么也找不到。假设我有一个DataFrame，它的列包括数字和分类数据。我正在尝试创建3个子图，每个子图显示这些数据。我不存在单独创建这些图的问题，pyplot显示了Cabin和PassengerId numbers中的字符串，但它不能在一个图形上绘制它们。甚至为每个图循

浏览 17提问于2021-01-30得票数 0

1回答

使用python对混合数据进行聚类

python、cluster-analysis

我正在尝试使用基于Huang，Z.的k_prototype聚类对包含混合数据(标称和有序)的数据集进行聚类:对具有混合数值和分类值的大型数据集进行聚类。我的问题是如何找到最佳的集群数量？

浏览 10提问于2019-05-16得票数 0

1回答

机器学习算法在数据属性子集中的应用

python、clustering、bigdata、categorical-data、dimensionality-reduction

我有一个庞大的混合数据集，它由数值属性和分类属性组成，在OneHotEncoding上形成一个具有很高维数的数据集。将机器学习算法(如K-均值聚类、降维和回归)应用于数据集子集是否明智？例如，首先将K-均值聚类应用于数值列，然后将结果与分类数据集连接起来。

浏览 0提问于2018-02-28得票数 1

回答已采纳

4回答

Kmeans中的分类数据

clustering、k-means

我需要在给定的数据集中执行聚类。有数字和分类值的分布。红色: 1，绿色: 2，蓝色:3或红色: 11，绿色: 25，蓝色: 30 如果我提供这样的映射，这会影响聚类的欧几里得距离吗？

浏览 0提问于2017-03-28得票数 1

2回答

如果我将数值属性和范畴属性分开聚类，这是错误的吗？

clustering

我有一个信用客户数据集，包含混合数据类型(数字和分类有几个级别)。我试图执行分段，这样我就可以得到k组，然后构建定义(基于我拥有的属性)。虽然有关于混合数据类型(K-原型、Gower距离的层次聚类)的数据聚类的解决方案，但为什么将数值属性和分类属性分开并单独提出定义是错误的呢？

浏览 0提问于2019-03-18得票数 2

回答已采纳

1回答

用异构(定量和定性)数据进行聚类？

machine-learning、clustering、data-analysis

我是一名博士生，我有一些我想分析的方法(算法)的结果。数据(结果)存储在csv文件中如下：-线条描述每个算法及其参数和结果。-一些列(特征)是定量的，另一些是定性的(列举类型)，最后一列是表示算法效率的结果，它是我可以在类(值的间隔)中转换的数值。首先，我想强调什么是好的和坏的算法的趋势。那么，有哪些特性帮助我获得了这些结果--我是机器学习<em

浏览 0提问于2019-02-10得票数 0

回答已采纳

1回答

如何评估集群的混合数据准确性，如K-Prototype>

cluster-analysis、data-mining

有许多用于聚类的有效性指标，但仅适用于数值数据。如何对混合数据(数字和分类)进行聚类？

浏览 0提问于2018-01-14得票数 0

1回答

在这种情况下，有什么更好:分类还是聚类？

classification、cluster-analysis

我从不同的来源( FB、Twitter、Linkedin )收集数据，然后用结构化格式制作这些数据。因此，现在我有一个包含10000行(10000个人)的csv文件，相关的数据是关于他们的名字、年龄、兴趣和购买习惯。对于聚类:我开始计算相似性和KMeans，但仍然无法得

浏览 2提问于2019-05-08得票数 0

回答已采纳

1回答

将混合数据转换为分类数据: dataframe

python、dataframe、categorical-data、one-hot-encoding

我有一个列(实际上是几个列)，其中包含混合类型的数据:分类数据和数值数据(对应于不同的类别)。然而，它们在本质上应该是绝对的。我的最终目标是为它们提供一个单一的编码表示。列中的数值大多为零。我想把这个专栏转换成分类的。因为我不知道使用get_dummies()进行转换的直接方法(混合到一个热

浏览 4提问于2019-07-08得票数 1

2回答

带因子变量的重要性/ varImp函数随机森林特征选择

r、types、classification、random-forest

为了建立分类模型，我尝试从数据集中选择最重要的特性。我的数据包含混合属性(数字属性和分类属性)。在应用随机森林从数据中选择特征后，我计划在R中应用(重要度或varImp)函数来提高模型的精度。我的问题是：可以直接在数据上应用随机森林而无需转换步骤，或者我必须将分类属性转换为二进制(0,1)。我已经在数值数据集上应用了带有重要&

浏览 0提问于2017-10-23得票数 1

1回答

K-均值不会导致弯头形状

python、machine-learning、k-means

我正在尝试在提供的数据集中使用k-means，只使用有关客户端的变量。问题是8个变量中有7个是分类的，所以我对它们使用了一个热编码器。为了使用肘部方法选择理想数量的集群，我对2到22个集群运行了KMeans，并绘制了inertia_值。但它的形状一点也不像肘部，它看起来更像一条直线。import numpy as npfrom s

浏览 13提问于2019-11-04得票数 1

回答已采纳

1回答

混合卷积神经网络与常规神经网络

machine-learning、neural-network、deep-learning

卷积神经网络通常是图像分类和语义分割的最佳选择。分类/数字数据(年龄、身高、城市等)另一方面，传统的机器学习模型，如(深度)随机森林模型、支持向量机模型或传统神经网络模型处理效果最好。是否有将卷积神经网络和传统神经网络相结合的混合结构来对图像和分类数据集进行分类？我确信这个问题以前已经解决过，我特别希望在一个公共库(PyTorch、Tensorflow、

浏览 0提问于2018-06-12得票数 1

1回答

在CSV文件中确定分类数据与数值数据--

java、csv

我有一个CSV (逗号分隔值)文件，其中混合了分类数据和数值数据。我希望能够确定数据是分类的还是数值的，这样我就可以在Swing中创建的散点图中以编程方式绘制数据。

浏览 0提问于2011-03-09得票数 2

1回答

在Python中创建决策树，数值变量和分类变量：“无法胁迫到系列”

python、pandas、machine-learning、scikit-learn、decision-tree

创建决策树和数据集有21列，是数字变量和分类变量的混合。使用sklearn，我知道它不支持分类变量。我使用标签编码将分类转换为数字，同时也分离数值变量。然后，我会认为我必须把这两个组相加在一起，这样我就可以分成测试和训练数据。但是，当我试图将这两个变量相加(最初是数值变量，并将分类变量转换为数字变量)时，我收到了一个ValueError。import pandas as pd im

浏览 3提问于2022-02-05得票数 0

1回答

PCA之前的数据缩放:如何处理分类值？

categorical-data、pca、normalization、feature-scaling

我必须将PCA应用于包含数值和分类值的数据集上。在预处理阶段，我用数字转换了所有的分类值，这样软件就可以处理它们(基本上我创建了虚拟变量)。现在，为了应用PCA，我必须对数据矩阵进行缩放，使其平均值等于0。我的问题是:规范分类值(现在是数字，但它们实际上是绝对值)是否有意义？我想不是，但那样的话，我该怎么做呢？

浏览 0提问于2018-06-10得票数 3

1回答

C#中混合数值和分类数据实现的K-均值聚类

clustering、k-means、beginner、library

我是一位数据挖掘方面的研究学者。我对K-均值聚类算法的C#实现感兴趣，该算法适用于混合数值和分类数据.

浏览 0提问于2014-09-17得票数 1

3回答

R:聚类验证方法(混合数据)

r、validation、cluster-analysis

我使用两种聚类方法k-原型和PAM聚类混合数据集包含数值和分类特征()。在混合数据的情况下有什么方法可以使用吗？

浏览 1提问于2018-03-14得票数 1

1回答

混合数据类型中的特征选择

python、machine-learning、feature-selection

我有一个庞大的数据集，其中既有数值变量，也有分类变量。我遇到过各种主要专注于数字或分类数据的特征选择技术，而不是它们的混合。有没有在这样的数据集上工作的特征选择技术？

浏览 19提问于2020-04-13得票数 0

回答已采纳

2回答

用连续变量和分类变量总结数据集

r、summary、categorical-data

如果数据集有混合变量:数值变量和分类变量，那么除了摘要(数据集)之外，是否有一种方法可以对其进行总结，其中每个类别的计数都包含在分类变量中，而平均值sd则包括在数值变量中？当前，我编写了一个代码片段，在检查每一列的数值或分类后生成一个列表。但是一个更简单的函数是有用的。一个例子可以是data.frame(v1 = c(1:3)，v2= c("a"

浏览 1提问于2015-08-23得票数 0

回答已采纳

1回答