在data.table中删除未使用的因子级别

，可以通过以下步骤实现：

首先，确保你已经加载了data.table包，并且已经将数据加载到data.table对象中。
使用levels()函数获取因子变量的所有级别。
使用table()函数计算每个级别的频数。
使用which()函数找到未使用的级别的索引。
使用droplevels()函数删除未使用的级别。

下面是一个完整的示例代码：

# 加载data.table包
library(data.table)

# 创建一个包含因子变量的data.table对象
dt <- data.table(factors = factor(c("A", "B", "C", "A", "B", "D")))

# 获取因子变量的所有级别
all_levels <- levels(dt$factors)

# 计算每个级别的频数
level_counts <- table(dt$factors)

# 找到未使用的级别的索引
unused_levels <- which(level_counts == 0)

# 删除未使用的级别
dt$factors <- droplevels(dt$factors)

# 打印结果
print(dt)

在这个例子中，我们创建了一个包含因子变量的data.table对象dt，其中包含了级别"A"、"B"、"C"和"D"。然后，我们使用levels()函数获取所有级别，使用table()函数计算每个级别的频数，使用which()函数找到未使用的级别的索引，最后使用droplevels()函数删除未使用的级别。最终，我们打印出结果。

对于这个问题，腾讯云没有特定的产品或链接与之相关。

在data.table中删除未使用的因子级别

我正在尝试找出在给定与this link中类似的列名字符矢量的情况下，在data.table中删除未使用的因子级别的语法。然而，在该示例中，"y“是data.table "x”实际列名。我想要传递一个包含列名的字符向量，但是我不知道它的语法。

浏览 24提问于2019-02-11得票数 2

回答已采纳

1回答

如何使用data.table在表格中删除未使用的级别？

、

考虑下面的data.table x=sample(letters[1:5],10,rep=T), 在使用某些因子字段具有未使用变量的data.table时，会多次出现这种情况。现在，如果我们使用下表：出现

浏览 4提问于2015-03-05得票数 6

3回答

默认情况下，覆盖[.data.frame以删除未使用的因子级别

、、、

当子集出现时，删除未使用的因子水平的问题出现在上。常见的解决方案包括在可能的情况下通过声明但有时，有序因子对于绘图是必要的，在这种情况下，我们可以使用方便的函数(如droplevels我的问题是，为了方便起见，我们可以在多大程度上通过覆盖数据帧的</e

浏览 0提问于2011-06-19得票数 3

回答已采纳

1回答

使用data.table在一列中根据另一列的因子级别替换NAs

、

DATA = data.table(col_1 = factor(c("A", "B", "C", "C", "B", "A", "C")),我有一个大数据集，其中我想用一个新的<e

浏览 0提问于2018-10-26得票数 1

回答已采纳

2回答

从数据框中删除因子级别

、、、、

我从下载了泰坦尼克号列车数据集：df = read.csv('titanic.csv', header=TRUE)df3:355 senior: 22 Q: 28 我的问题是使用变量Embarked), xlab="Port of Embarkment", ylab="

浏览 30提问于2019-11-28得票数 1

2回答

用x以上的观测值按因子水平划分观测值

、、

[nn]]) : 我想做的是子集lm-函数，只使用比x观测值更多的因子级别例如，该data.table有一个因子(some_NA_factor)，对于该因子，级别1, 2 , 4, 5有17个观测值，而级别3有16个。我想直接(在lm-function中</em

浏览 0提问于2019-08-14得票数 2

回答已采纳

1回答

ggplot图层在首次放置时会打乱顺序

、

我的图有分类的X轴和多种类型的元素可供绘制： dt1 <- fread(' a1 bar 40 # here it will be b1 - c1 - a1 - d1 - a2 如果我先用geom_point()然后用geom_bar()构建图，那么X轴的顺序是正确的但是，如果我先使用geom_bar()作为第一层，然后<em

浏览 30提问于2020-11-02得票数 2

回答已采纳

1回答

dataframe中的str()函数

、、

我正在从R中的数据帧中删除一个变量；然后检查输出，如下所示：str(bill_11) 0 103668 0 0 我的问题是；我已经降低了因子月的3个水平，**但新的数据框架仍然显示“月”有4个水平。虽然子集操作是正确的</em

浏览 4提问于2013-02-20得票数 1

1回答

我有一个数据集，其中我试图循环一个因子变量(location)，并为该因子的每个级别构建一个单独的模型。但是，根据location的不同，存在单级因子变量，这给出了以下错误： Error in `contrasts<-`(`*tmp*`, value = contr.funs[1 + isOF[nn]])more levels Called from: `contrasts<-`(`*tmp*`, value = contr.funs[1 + isOF[nn

浏览 10提问于2020-12-07得票数 0

回答已采纳

3回答

省略行错误

我想省略特定列(Y)中具有NA的数据帧中的行。我使用的是df<- [!is.na (df$y), ] -这得到了我的:错误:意外的'[‘在"df<- [“我已经尝试了df<- [(!is.na (df$y)), ]与同样的错误。有人能帮我找出问题所在吗。谢谢。

浏览 3提问于2015-06-16得票数 2

回答已采纳

1回答

将ave用于r中的自定义函数时出错

、、

我使用ave()函数来查找数据中每个单独主题的偏自相关(pacf)。# get pacf coefficient for each ID 在我的原始巨大数据帧上然而，当我在一个“虚构的”数据帧上做这件事时，这段代码就可以工作了。我不确定为什么这是一个问题。有没有其他方法可以在不使用av

浏览 7提问于2019-05-07得票数 1

1回答

geom_col中标签的顺序有误，尽管因子级别设置正确

、

我正试图在ggplot2中制作一个likert/发散的条形图。尽管我使用因子级别设置了级别的顺序，但barplot中的顺序是不正确的(我使用geom_col)，但在图例中，顺序是正确的。谢谢library(data.table) data =

浏览 3提问于2022-09-15得票数 0

2回答

用data.table从另一个表中更新因子级别

、、

我想从另一个表中更新表的非数字列的因子级别，set.seed(1453) bigger_table <- data.table(region在我想要的输出中；在子集表中，region列应该是因子，并且具有从bigger_table派生的级别

浏览 8提问于2021-11-11得票数 0

回答已采纳

1回答

使用fread丢失因子顺序导入csv文件

、、、

当我尝试使用data.table函数fread读取先前保存的CSV文件时，我的数据的分类顺序没有被保留。它按字母顺序格式化。","Henry"), 然后使用setattr函数标记名为subject的因子列的级别。subject列是因子，级别与我

浏览 2提问于2020-10-01得票数 1

回答已采纳

1回答

R boxplot ggplot问题

、、

我是R的新手，我正在尝试使用ggplot和一些逆向工程来绘制一些图形。== "B"] = "A"ggplot(data, aes(x = experiments, y = percentages)) + geom_boxplot()非常感谢你的帮助

浏览 4提问于2012-01-18得票数 1

回答已采纳

1回答

为什么tapply()显示我过滤掉的条目？

我已经提取了虹膜data.frame，然后从物种中过滤掉了"setosa“。当我执行tapply()时，它给出了最初在该专栏中的所有3件事的摘要。为什么它将setosa显示为NA。

浏览 0提问于2019-03-28得票数 2

1回答

已删除的空白行信息仍然保留

、

150 F3 140 M5 90 F但是，当我要做统计时，仍然需要考虑空行，例如：我是如何从我的分析中删除这个空白信息的<

浏览 0提问于2019-04-29得票数 1

回答已采纳

2回答

data.table和表的意外行为

、

数据来自我玩过的另一个问题： country=c(rep(1,4),rep4 2 7#9: 4 2 9这是一个令人惊讶的行为自然的后续是-它不应该是2，也就是说这是一个bug吗？我期望的是 dt[, blah, by = use

浏览 1提问于2013-04-25得票数 7

2回答

移除一行不会更改长度()和级别()的输出。

、

使用下面的代码，我导入一个数据集，探索它并删除一行。删除行后，“长度和级别”命令的输出将保持不变。为什么？我调查性别值为33529的那一排在检查行后，我决定删除它，并再次检查性别变量。length(levels(MT$sex))1 3当我浏

浏览 1提问于2017-09-28得票数 1

回答已采纳

1回答

在计数data.table后完成所有组合

、、

我有一些列作为因子和一些作为字符的数据。我想计数所有的组合，并用data.table语法编写一个函数。# Load libraries library(data.table) filter(Species我使用的是setkeyv，而不是setkey，因为我需要使用字符向量g。在那里，指示所有因子级别和所有字符列的

浏览 0提问于2021-08-16得票数 1

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

在data.table中删除未使用的因子级别

相关·内容

在data.table中删除未使用的因子级别

如何使用data.table在表格中删除未使用的级别？

默认情况下，覆盖[.data.frame以删除未使用的因子级别

使用data.table在一列中根据另一列的因子级别替换NAs

从数据框中删除因子级别

用x以上的观测值按因子水平划分观测值

ggplot图层在首次放置时会打乱顺序

dataframe中的str()函数

lm()循环因子变量，同时从模型中删除单级因子变量

省略行错误

将ave用于r中的自定义函数时出错

geom_col中标签的顺序有误，尽管因子级别设置正确

用data.table从另一个表中更新因子级别

使用fread丢失因子顺序导入csv文件

R boxplot ggplot问题

为什么tapply()显示我过滤掉的条目？

已删除的空白行信息仍然保留

data.table和表的意外行为

移除一行不会更改长度()和级别()的输出。

在计数data.table后完成所有组合

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐