首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >删除R中列的最后一个下划线之后的所有内容

删除R中列的最后一个下划线之后的所有内容
EN

Stack Overflow用户
提问于 2016-11-29 12:14:00
回答 2查看 13.4K关注 0票数 7

我有一个数据帧,对于一个特定的列,我想去掉最后一个下划线之后的所有内容。

所以:

代码语言:javascript
运行
复制
test <- data.frame(label=c('test_test_test', 'test_tom_cat', 'tset_eat_food', 'tisk - tisk'), 
                   stuff=c('blah', 'blag', 'gah', 'nah') , 
                   numbers=c(1,2,3, 4))

应该变成

代码语言:javascript
运行
复制
result <- data.frame(label=c('test_test', 'test_tom', 'tset_eat', 'tisk - tisk'), 
                   stuff=c('blah', 'blag', 'gah', 'nah') , 
                   numbers=c(1,2,3, 4))

我有:

代码语言:javascript
运行
复制
require(dplyr)
test %>%
  mutate(label = gsub('_.*','',label))

但这会删除第一个下划线中的所有内容,并给出我

代码语言:javascript
运行
复制
 wrong_result <- data.frame(label=c('test', 'test', 'tset', 'tisk - tisk'), 
                   stuff=c('blah', 'blag', 'gah', 'nah') , 
                   numbers=c(1,2,3, 4))
EN

回答 2

Stack Overflow用户

发布于 2016-11-29 12:24:12

我们可以使用sub,这可以在没有任何外部包的情况下完成

代码语言:javascript
运行
复制
test$label <- sub("_[^_]+$", "", test$label)
test$label
#[1] "test_test"   "test_tom"    "tset_eat"    "tisk - tisk"
票数 10
EN

Stack Overflow用户

发布于 2016-11-29 13:56:50

这也是可行的:

代码语言:javascript
运行
复制
gsub('(.*)_\\w+', '\\1', test$label)
#[1] "test_test"   "test_tom"    "tset_eat"    "tisk - tisk"
票数 4
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/40857694

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档