基于数据帧因子元数据的级别创建二进制编码列

我想创建因子列的“二进制编码列”。有各种各样的代码，它们很好地工作于具有许多行的数据帧(即，每个级别至少有一行)。我的用例是，在数据框中，我可能只将因子级别作为“元数据”。因此，给出一个这样的数据帧： haves <

浏览 15提问于2020-09-02得票数 1

回答已采纳

1回答

R-汇总每列的因子级别计数

、、、、

我有一个数据帧，其中包含许多列，这些列都编码为因子变量。每一列都是基于只有两个选项的问题: 1=yes和2=no，或者缺少。每一行都是一个参与者。这里是一个简化的版本： Q_1 Q_2 Q_3 2 1 1 2 1 2 理想情况下，我希望创建一个概述数据框架，其中每个问题作为行，以及每个因素

浏览 27提问于2021-09-15得票数 0

1回答

对于决策树，我应该将二进制因子变量编码为0还是1？

、

我正在构建一棵决策树，我有一堆二进制变量，我将它们编码为因子。它们每个都有两个级别，第一个级别是“有属性”，第二个级别是“没有属性”。该属性被替换为列的名称，如"has blue rose pedals“ 这是我正在应用我的数据的模型，使用iris作为示例代码 library(rpart)par(xpd

浏览 4提问于2020-10-07得票数 0

回答已采纳

3回答

如何去除R中的一个因子级？

、

我需要将变量从R中的数据帧中删除，我的数据有一列有18个因素： drop if rama1 == 99然后，为了在Stata中创建

浏览 1提问于2015-08-30得票数 1

回答已采纳

2回答

Xgboost -如果整数仅为0和1，我们是否必须将它们转换为因子

、、

我在一个数据帧中有许多列，它们是标志"0“和"1”。当我导入数据帧时，它们属于"integer“类。我需要将它们转换为因子吗?因子将成为级别1和2，而目前它们几乎是相似的0和1，尽管是整数我计划稍后使用xgboost来构建一个预测模型。Xgboost只适用于数字列，所以如果我将列转换为factor的列<

浏览 38提问于2017-02-19得票数 1

回答已采纳

1回答

在没有数据的情况下跟踪因素水平

、

免责声明:这个项目最初是以其他人的代码开始的，我相信会有一些非优化的设计决策，但我的手比我自己的项目要紧一些。我有一个机器学习算法，它使用一个经过训练的模型对象，并结合一组评分数据来创建一个得分数据的数据框架。模型对象是一个具有公式和数据框架的列表。模型数据框架的作用之一是确保评分数据框架的<

浏览 6提问于2012-08-23得票数 2

2回答

对于每个观测结果，在由因子确定的子集上找到相应的厘米。

假设我有这样一个数据框架：我想要创建一个新的列，它将包含一个观察属于的厘米，在每个因子级别上分别计算。怎样才是一种相当简单和有效的方法来做到这一点？))$df[, "f"]) 然而，这只是给了所有观察的<

浏览 1提问于2017-05-31得票数 0

回答已采纳

1回答

基于从特定字符或字符串开始的因素级别的子集数据帧

、、、

我正在尝试根据一个因子(这里是ID)对数据帧进行子集。我想要的是基于因子级别的子集，从一个特定的字符开始。下面是一个数据帧示例： ID = c("100", "100a", "101", "103", "204", "206", "207", "207a",

浏览 1提问于2017-08-02得票数 3

1回答

关于R中的食谱包

、

您好，我正在机器学习模型中使用功能工程的食谱。然而，当我使用step_dummy时，伪变量被视为数值变量，而不是因子。我认为当我们使用随机森林或其他树模型时，这可能是有问题的。所以X轴有0.25，0.5......这应该只有0和1(因为是虚拟的)。

浏览 7提问于2020-02-29得票数 1

1回答

R: mapply函数返回错误:因子的级别集不同

、

我有两个数据帧(DfA和DfB)。每个数据帧有三个因子变量:种类、类型和区域。DfA还有一个数值列，我想使用它来根据共享属性估计DfB的一个新列中的数值。我有一个函数，它询问物种、类型和地区，然后使用这些属性创建DfA的子集，并在子集上运行算法来估计新值。当我运行该函数并手动指定这些值作为测试时，它工作得很好。如果DfB中的所有因子级别和组合在D

浏览 1提问于2014-03-29得票数 0

1回答

将grepl转换为函数

、、

这个想法非常简单:识别data.frame的级别，提取具有特定级别的所有行，并将其写入新的data.frame。所以一个非常糟糕的解决方案应该是这样的。

浏览 0提问于2018-06-03得票数 0

1回答

为什么在cassandra中我们需要键空间级的复制因子，为什么不需要列家族级的复制因子？

、

为什么在cassandra中我们需要关键空间级的复制因子？为什么不在列家庭层面？

浏览 4提问于2014-02-02得票数 1

回答已采纳

1回答

按列索引划分为数据帧列表

、

在基数R中是否有一种简单的方法，可以根据索引因子级别(从另一个数据帧中提取)将数据帧拆分为数据帧列表？(num1 = 1:26, let = letters, num2 = 10:35, LET = LETTERS)但是，假设我们有一个指示列的因子级别的索引

浏览 2提问于2018-08-22得票数 2

回答已采纳

2回答

以整数的形式从dataframe获取因子的级别

考虑到，我知道：gender <- factor(c("male", "female", "female", "male"))levels(gender) "female" "male我的问题是，如何才能完全基于数据帧的元数据

浏览 2提问于2020-09-02得票数 3

回答已采纳

1回答

如何在具有不同因子级别的不同数据帧中使用Forcats::Fct_Collapse

、、

library(tidyverse)我有两个简单的数据帧(底部的代码)，我想通过折叠"Animal“列来创建一个新的重新编码的变量。但是，我想创建一个函数，将fct_collapse应用于许多具有相同变量的不同数据帧，只是有些数据帧可能缺少一个或两个因子级别

浏览 3提问于2018-02-02得票数 1

回答已采纳

2回答

防止因素等级的排序

、

当我提取R中数据帧列的因子级别时，它们会自动排序(按字母顺序排列)。我怎么才能阻止这一切？也就是说，我希望级别的顺序与数据帧列中的顺序相同。data.frame(Names = c("Paul McCartney", "John Lennon")) -> my.data “约翰列侬”“保罗M

浏览 3提问于2013-06-03得票数 4

回答已采纳

1回答

包含空值的分类数据到R因子的Rpy2转换

、、、、

我有一个pandas数据帧，它有一个包含NaN值的分类列，例如：g 2 Cdtype: category在pandas中，NaN不是一个类别，但您可以在分类数据中包含我想在Jupyter笔记本

浏览 2提问于2018-11-15得票数 0

1回答

R:混合数据类型的数据帧的类型转换

、、

我一般都喜欢R，但是类型转换的问题让我发疯了。我从数据库连接中读取数据帧。结果是一个带有字符列的数据帧。我知道第一列是日期格式，其他的都是数字格式。然而，无论我如何尝试将数据帧的字符列转换为正确的类型，它都没有成功。当将数据帧转换为矩阵，然后返回到数据框架时，

浏览 1提问于2016-08-12得票数 1

回答已采纳

1回答

根据列的因子级别自动创建数据帧

、

我有一些带有经理id、类型和位置的假案例数据。我想要自动创建数据帧，其中包含管理人员在给定位置的平均案例数。type <- data.frame(type)df <- cbind(manager_id, type, location)total <

浏览 3提问于2021-12-17得票数 0

回答已采纳

2回答

是否有一种方法可以在一行中创建多个因素级别的新df特性？

是否有一种方法可以将依赖于现有列的多个因素级别的列添加到一行中的数据帧中？如果新列有两个因子级别和两个以上的因子级别，那么答案会改变吗？mtcars df$mpg_rating[df$mpg>20] <- "ok" df$mpg_rating[df$mpg>30] <

浏览 0提问于2019-03-29得票数 2

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

R-汇总每列的因子级别计数

对于决策树，我应该将二进制因子变量编码为0还是1？

如何去除R中的一个因子级？

Xgboost -如果整数仅为0和1，我们是否必须将它们转换为因子

在没有数据的情况下跟踪因素水平

对于每个观测结果，在由因子确定的子集上找到相应的厘米。

基于从特定字符或字符串开始的因素级别的子集数据帧

关于R中的食谱包

R: mapply函数返回错误:因子的级别集不同

将grepl转换为函数

为什么在cassandra中我们需要键空间级的复制因子，为什么不需要列家族级的复制因子？

按列索引划分为数据帧列表

以整数的形式从dataframe获取因子的级别

如何在具有不同因子级别的不同数据帧中使用Forcats::Fct_Collapse

防止因素等级的排序

包含空值的分类数据到R因子的Rpy2转换

R:混合数据类型的数据帧的类型转换

根据列的因子级别自动创建数据帧

是否有一种方法可以在一行中创建多个因素级别的新df特性？

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐