一个热编码-虚拟-在几列中，然后与原始df和pandas连接

、

我有一个df，其中有几个名义上的分类列，我想要为这些列创建虚拟对象。这是一个模拟的df： data = {'Frukt':[1, 2, 3, 4, 5, 6, 7, 8, 9, 10],

浏览 25提问于2019-10-15得票数 0

回答已采纳

2回答

从其他熊猫栏创建新栏目

、、、

我想从列创建一个新的列。“类型”列包含一个或多个类型，我希望为每个类型名称创建一个列。然后，我想在每个专栏中填写1和0，这取决于它们是否有这种类型。我不需要这样的东西

浏览 6提问于2022-05-12得票数 0

回答已采纳

2回答

保存并加载ML的一个热编码

、、

对于机器学习回归模型，我需要对某些列进行热编码。培训数据和模型拟合正在我的本地PC上进行。在此之后，模型将上传到服务器进行预测。问题是新的数据不是初始编码的一部分，所以我需要像在我的PC上学习数据一样对它进行热编码。我发现我可以保存编码器(sklearn.preprocessing -> OneHotEncoder)。为了更容易理解这里，我刚刚创建了一个笔记本与一些非常简单的虚拟数据。df_n

浏览 3提问于2019-12-28得票数 4

回答已采纳

1回答

python/scikit中类别变量的推算

我有一个包含23列分类字符串变量的csv文件，例如性别、位置、技能集等。这个是可能的吗？我已尝试从sklearn_pandas导入CategoricalImputerimpute

浏览 0提问于2018-03-29得票数 0

1回答

如何在对分类变量进行编码后跟踪列？

、、、、

我想知道如何在对数据集执行数据预处理之后跟踪数据集的原始列？import numpy as np

浏览 0提问于2020-02-06得票数 3

回答已采纳

2回答

将逗号分隔字符串的熊猫列转换为虚拟变量

、、、

在我的dataframe中，我有一个分类变量，我想把它转换成虚拟变量。该列有多个值，以逗号分隔：1 'a,b,c'3 'd'最终，我希望每个可能的离散值都有二进制列；换句话说，最终列计数等于原始列中唯一值的数目

浏览 3提问于2017-10-21得票数 21

回答已采纳

2回答

如何在执行OneHotEncoding和规范化之后可视化数据？

、、、、

我有一个数据集，我使用标准标量执行了OneHotEncoding和标准化操作，现在我已经对数据进行了预处理，我必须将其可视化，但是在将数据转换为熊猫数据时，它显示了错误。我已经采取的步骤 categorical_features = [column names which are categorical in nature

浏览 0提问于2021-09-28得票数 0

1回答

在单个Pandas DataFrame中按名称对重复列进行连接

、

我有一个热编码类别，从一个列到多个True/False值列。在原始格式中，类别以娱乐(如GAME_ARCADE )的形式出现在单个“类别”列中。我拆分“，”，将结果存储在一个集合中，然后与原始列匹配。): df[genre] = [genre in ca

浏览 0提问于2019-08-21得票数 1

1回答

对于我的模型，如何获得大于.5的平均值？

、、、

我正试图建立一个分类模型。其中一个名为“专长”的变量有200个值。基于之前的一篇文章I 锯子，我决定包括平均值最高的值。我的想法大于0.5。我如何过滤专业，使平均值仅大于0.5？

浏览 0提问于2022-04-13得票数 2

1回答

在CatBoost基准测试中，使用了什么样的预处理来编码分类变量？

、

最近，我开始使用CatBoost进行机器学习模型的快速原型设计，这受到了与XGBoost、LightGBM和h2o相比的杰出的CatBoost的启发。我并不完全清楚在基准测试中使用了什么样的预处理来编码分类特性，以及不使用简单的一种热编码的理由。左加入分类列v

浏览 3提问于2019-01-13得票数 1

1回答

从用逗号分隔的字符串中获取列，考虑每一行的值。

、

我想将以逗号或列表分隔的字符串转换为如下所示的列A | X | [1, 2, 3] | C | Z | [5, 1] | 或A | X | 1,2,3 | B | Y |

浏览 4提问于2022-06-04得票数 0

回答已采纳

2回答

如何在深度学习中使用分类列？

、、、、

但我的数据集也包含分类列，因此在预处理过程中遇到了错误。因此，我尝试使用OneHotEncoder和LabelEncoder对分类列进行编码，但我不知道如何处理它。

浏览 1提问于2020-12-21得票数 0

1回答

如何使用一热编码

、、、

所以我试着做一个项目，要求为某个部分做一个热编码。但我不知道怎么用。我一直在用谷歌来尝试和理解，但我就是无法理解。我的问题如下。现在，我们也要使用分类功能！为此，应将每个分类特性替换为功能表中的虚拟列(每个类别特性的可能值为一列)，然后以二进制方式对其进行编码，以便最多只有一个虚拟列一次可以接受“1”(其余列为零)。例如，“性别”可以有两个值“m”和“f”。因此，我们需要用名为“

浏览 5提问于2016-10-16得票数 0

回答已采纳

1回答

调用多个dataframe列名以生成新的dataframe键错误

、、

经过一次热编码2种不同的功能，然后将得到的一次热编码列与Pandas中的原始数据have连接起来，我就有了3个数据格式。第一个是OneHotZips (它包含我的一个热编码特性#1)。第二个是OneHotYearBuilt (相同的东西，也就是我的特性#2作为数据帧中的一个热编码</

浏览 0提问于2019-03-11得票数 0

回答已采纳

1回答

一个热编码标签返回到DataFrame

、、、

我想对数据帧应用一些分类器，因此必须对df进行一次热编码。我现在有标签了，但不知道如何继续？如何将标签恢复为df类型，以及如何使用新的df？onehotlabels = enc.transform(labeled_df).toarray() oneh

浏览 10提问于2019-07-09得票数 0

2回答

python中二进制单热点(一K)编码的问题

、、、

例如，如果有一个颜色列(分类变量)，其值为“红色”、“蓝色”、“黄色”和“未知”，那么二进制人的热编码将颜色列替换为' color =red‘、' color =blue’和‘color=黄色’。我从熊猫数据框架中的数据开始，我想用这些数据来训练一个与科学知识相关的模型。我知道两种方法来做二进制一热编码，其中没有一种让我满意。 Pandas和get_dumm

浏览 1提问于2015-08-27得票数 7

回答已采纳

1回答

如何在一个热编码中修复此ValueError？

、、

当尝试在Jupyter-Notebook中运行以下代码时，会导致以下错误：dataset_test.drop_duplicates

浏览 4提问于2021-05-25得票数 0

1回答

将两个数据文件中的热编码组合起来

、、

I尝试将数据帧df2列的结果组合到另一个称为df的数据帧中，以便对其进行热编码并添加到df的管道中。要将我的主题标记数据框架的结果通过df2‘主题标签’列组合起来，以便对其进行热编码，然后将其作为第四个因素添加到推荐程序中。我试过什么我有两个独立的工作数据框架，所以我创建了df2

浏览 1提问于2020-07-03得票数 0

回答已采纳

5回答

如何使熊猫get_dummies在培训/验证/测试中对齐？

、、

我有3组数据(培训、验证和测试)，当我运行时：它给了我一定数量的特征但是，当我在验证数据中运行它时，它给出了一个不同的数字，用于测试也是一样的。是否有任何方法使所有数据集标准化(我知道是错误的词)，从而使特性的数量对齐？

浏览 0提问于2019-06-24得票数 4

回答已采纳

1回答

如何从csv文件输入进行一次热编码

、、、

我有一个csv文件，我用它读取df = pd.read_csv("inputfile") 我希望能够对一个名为'col'的字符串列进行一个热编码，并生成一个稀疏矩阵，其中包含所有的特性

浏览 6提问于2016-09-02得票数 3

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

从其他熊猫栏创建新栏目

保存并加载ML的一个热编码

python/scikit中类别变量的推算

如何在对分类变量进行编码后跟踪列？

将逗号分隔字符串的熊猫列转换为虚拟变量

如何在执行OneHotEncoding和规范化之后可视化数据？

在单个Pandas DataFrame中按名称对重复列进行连接

对于我的模型，如何获得大于.5的平均值？

在CatBoost基准测试中，使用了什么样的预处理来编码分类变量？

从用逗号分隔的字符串中获取列，考虑每一行的值。

如何在深度学习中使用分类列？

如何使用一热编码

调用多个dataframe列名以生成新的dataframe键错误

一个热编码标签返回到DataFrame

python中二进制单热点(一K)编码的问题

如何在一个热编码中修复此ValueError？

将两个数据文件中的热编码组合起来

如何使熊猫get_dummies在培训/验证/测试中对齐？

如何从csv文件输入进行一次热编码

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐