需要查看汽车型号的制造商名称
如下所示:
尝试使用下面的函数,但它正在创建为列表
strsplit(carz$maker,split = " ")
发布于 2019-05-25 23:35:20
这是一种将lapply()
与汽车趋势汽车数据框结合使用的方法。
data(mtcars)
mtcars$type <- rownames(mtcars)
mtcars$make <-unlist(lapply(strsplit(mtcars$type," "),function(x){x[[1]]}))
head(mtcars)
结果是:
> head(mtcars)
mpg cyl disp hp drat wt qsec vs am gear carb
Mazda RX4 21.0 6 160 110 3.90 2.620 16.46 0 1 4 4
Mazda RX4 Wag 21.0 6 160 110 3.90 2.875 17.02 0 1 4 4
Datsun 710 22.8 4 108 93 3.85 2.320 18.61 1 1 4 1
Hornet 4 Drive 21.4 6 258 110 3.08 3.215 19.44 1 0 3 1
Hornet Sportabout 18.7 8 360 175 3.15 3.440 17.02 0 0 3 2
Valiant 18.1 6 225 105 2.76 3.460 20.22 1 0 3 1
type make
Mazda RX4 Mazda RX4 Mazda
Mazda RX4 Wag Mazda RX4 Wag Mazda
Datsun 710 Datsun 710 Datsun
Hornet 4 Drive Hornet 4 Drive Hornet
Hornet Sportabout Hornet Sportabout Hornet
Valiant Valiant Valiant
>
注意,一些额外的数据清理是必要的,因为Valiant和Duster是由普利茅斯制造的,卡玛罗Z28是由雪佛兰制造的,而大黄蜂4驱动器是由美国汽车制造的,也被称为AMC。
关于注释中关于lapply()
中使用的语法的问题,我使用lapply()
来处理strsplit()
的结果,包括从列表的每个元素中提取第一个单词的anonymous function。
由于R函数的输出可以用作另一个函数的参数,因此此解决方案嵌套函数以产生所需的结果。
akrun提供的sapply()
答案做了同样的事情,使用strsplit()
的输出作为输入,并使用[
(提取操作符的四种形式之一)来提取数据。sapply()
还会生成一个向量而不是列表作为其输出。
发布于 2019-05-26 00:42:54
当然,还有一个tidyverse
解决方案;这就是设计separate
函数的目的。
library(tidyverse)
mtcars %>% rownames_to_column("type") %>%
separate(type, c("make", "model"),
extra="merge", fill="right", remove=FALSE)
显示所选的输出:
type make model
1 Mazda RX4 Mazda RX4
2 Mazda RX4 Wag Mazda RX4 Wag
3 Datsun 710 Datsun 710
4 Hornet 4 Drive Hornet 4 Drive
5 Hornet Sportabout Hornet Sportabout
6 Valiant Valiant <NA>
7 Duster 360 Duster 360
8 Merc 240D Merc 240D
9 Merc 230 Merc 230
10 Merc 280 Merc 280
https://stackoverflow.com/questions/56306211
复制相似问题