问题:
如何使用R快速有效地从数据文件中删除所有特殊字符?
进度:
因此,详细介绍了如何删除特殊字符。我可以将gsub函数应用于单个列(图1和2),但不能应用整个dataframe。
问题:
我的dataframe由整数、字符串等组成的100+列组成。当我尝试在dataframe上运行gsub时,它不会返回我想要的输出。相反,我得到了如图3所示的内容。
df <- read.csv("C:/test.csv")
dfa <- gsub("[[:punct:]]", "", df$a) #this works on a single c
我正在尝试将空单元格替换为与应用了使用dplyr的filter的列不同的列中的零。例如,
temp %>%
filter(Publication.type == "Link") %>%
# ** Insert function or 2 to replace NAs by zeroes in another column,
say Clicks_30min **
我相信is.na函数不能在这里工作,replace也不能。对其他解决方案也持开放态度。mutate_at能工作吗?我尝试变异,但它抛出了一个错误。
我有一个有100列的数据框,我想把它们都转换成因子。我们假设数据帧,
a <- as.integer(c(1,2,1,2,1,1))
b <- as.integer(c(1,2,3,3,3,1))
df <- data.frame(a,b)
我在试这个,
library(dplyr)
colwise(df, as.factor(df))
这会给我一个像这样的错误,
> colwise(df, as.factor(df))
Error in sort.list(y) : 'x' must be atomic for 'sort.list'
我有一个有很多类别的数据框架。对于一个类别,我计算一个移位值。有了这个值,我想用这个值向下移动数据帧这一部分的每一列。为了执行这一操作,我认为使用“嵌套的tibble”,然后使用map函数purrr来执行移位可能是有用的。
为了人工再现这个问题,我会用虹膜数据集创建这样一个数据框架:
df <- iris %>% group_by(Species) %>%
nest() %>% mutate(shift = as.integer(c(1, 2, 3)))
df
# A tibble: 3 x 3
Species data s
我正在执行数据分析和清理R使用tidyverse。我有一个包含23列的数据框架,其中包含'NO‘、'STEADY’、'UP‘和'down’。我想将这23列中的所有值更改为0,如果是'NO',‘稳态’,而在其他情况下是1。
我所做的是,我根据名称键创建了一个列表,其中保留了我的所有列,之后我使用for循环、ifelse语句和变体。
请看下面的代码
# Column names are kept in the list by name keys
keys = c('metformin', 'repaglinide',