文章/答案/技术大牛

发布

社区首页 >问答首页 >提取数据并创建一个新的重复值列

问提取数据并创建一个新的重复值列
EN

Stack Overflow用户

提问于 2018-02-15 15:25:36

回答 1查看 55关注 0票数 1

我正在使用这样的脚本收集一些数据：

library(tidyverse)
library(rvest)
library(magrittr)
library(stringr)

foo_matrix <- read_html("#address")

test <- foo_matrix %>%  
html_nodes(#Retrieval Information) %>%
html_text() %>%
str_trim

它返回的输出如下所示：

1“红队”"Mike Johnson“"QB”"6-1“"191”6 "99“"21”"2“"5”“乔·史密斯”11 "OT“"6-3”"290“"98”"55“16 "3”"1“

我想要做的是提取字符串中的第一个值("Red“)，然后将剩下的数据作为这样的8列矩阵来创建：

Mike Johnson QB 6-1 191 99 21 2 5
Joe Smith    OT 6-3 290 98 55 3 1

但是，我想要创建第九列，该列从最初提取的字符串中获取值，并将其应用于所有行，因此最终结果如下：

Mike Johnson MD 6-1 191 99 21 2 5 Red Team
Joe Smith    VA 6-3 290 98 55 3 1 Red Team

最好的方法是什么？)(提取值，然后取b.)将它作为第九列遍历所有行？

web-scraping

rvest

stringr

回答 1

Stack Overflow用户

发布于 2018-02-15 15:53:33

也许有更干净的方法可以做到这一点。

假设团队始终是第一个元素，您可以首先将团队与人员数据分离开来。

然后假设您的人员数据总是有8列，您可以在列表中split它们，并使用as_tibble和bind_rows在唯一的data.frame中转换结果。

最后，使用add_column添加团队。mutate也应该做到这一点。

library(stringr)
library(purrr)
library(tibble)
library(dplyr)


data <- c("Red Team", "Mike Johnson", "QB" ,"6-1","191",               
 "99" ,"21" ,"2","5","Joe Smith" ,     
 "OT" ,"6-3" , "290" , "98" ,"55",      
 "3"  ,"1")

team <- data[1]
people <- data[-1]

resulting_df <- people %>%  
  split(ceiling(seq_along(people)/8)) %>% 
  map(~ as_tibble(t(.x))) %>% 
  bind_rows() %>% 
  add_column(team = team)

resulting_df
#> # A tibble: 2 x 9
#>   V1           V2    V3    V4    V5    V6    V7    V8    team    
#>   <chr>        <chr> <chr> <chr> <chr> <chr> <chr> <chr> <chr>   
#> 1 Mike Johnson QB    6-1   191   99    21    2     5     Red Team
#> 2 Joe Smith    OT    6-3   290   98    55    3     1     Red Team

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/48810685

复制

相似问题

问提取数据并创建一个新的重复值列
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问提取数据并创建一个新的重复值列EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问提取数据并创建一个新的重复值列
EN