我有一个数据帧,对于一个特定的列,我想去掉最后一个下划线之后的所有内容。
所以:
test <- data.frame(label=c('test_test_test', 'test_tom_cat', 'tset_eat_food', 'tisk - tisk'),
stuff=c('blah', 'blag', 'gah', 'nah') ,
numbers=c(1,2,3, 4))应该变成
result <- data.frame(label=c('test_test', 'test_tom', 'tset_eat', 'tisk - tisk'),
stuff=c('blah', 'blag', 'gah', 'nah') ,
numbers=c(1,2,3, 4))我有:
require(dplyr)
test %>%
mutate(label = gsub('_.*','',label))但这会删除第一个下划线中的所有内容,并给出我
wrong_result <- data.frame(label=c('test', 'test', 'tset', 'tisk - tisk'),
stuff=c('blah', 'blag', 'gah', 'nah') ,
numbers=c(1,2,3, 4))发布于 2016-11-29 12:24:12
我们可以使用sub,这可以在没有任何外部包的情况下完成
test$label <- sub("_[^_]+$", "", test$label)
test$label
#[1] "test_test" "test_tom" "tset_eat" "tisk - tisk"发布于 2016-11-29 13:56:50
这也是可行的:
gsub('(.*)_\\w+', '\\1', test$label)
#[1] "test_test" "test_tom" "tset_eat" "tisk - tisk"https://stackoverflow.com/questions/40857694
复制相似问题