文章/答案/技术大牛

发布

社区首页 >问答首页 >列中序列的重复

问列中序列的重复
EN

Stack Overflow用户

提问于 2019-07-27 08:45:18

回答 4查看 133关注 0票数 0

我想一次又一次地重复给定的序列，在R中填充大约5000行。

时间数据集：

8.00.00 AM
9.00.00 AM
10.00.00 AM
11.00.00 AM
12.00.00 PM
1.00.00 PM
2.00.00 PM
3.00.00 PM
4.00.00 PM
5.00.00 PM
6.00.00 PM
7.00.00 PM
8.00.00 PM
9.00.00 PM

回答 4

Stack Overflow用户

回答已采纳

发布于 2019-07-27 19:59:44

可能有几个原因可以让你看到空白。我将集中讨论两个可能性：NAs和文字空白。

srcvec <- c("8.00.00 AM", "9.00.00 AM", "10.00.00 AM", "11.00.00 AM", "12.00.00 PM", 
"1.00.00 PM", "2.00.00 PM", "3.00.00 PM", "4.00.00 PM", "5.00.00 PM", 
"6.00.00 PM", "7.00.00 PM", "8.00.00 PM", "9.00.00 PM", NA, ""
)
rep(srcvec, len=30)
#  [1] "8.00.00 AM"  "9.00.00 AM"  "10.00.00 AM" "11.00.00 AM" "12.00.00 PM" "1.00.00 PM" 
#  [7] "2.00.00 PM"  "3.00.00 PM"  "4.00.00 PM"  "5.00.00 PM"  "6.00.00 PM"  "7.00.00 PM" 
# [13] "8.00.00 PM"  "9.00.00 PM"  NA            ""            "8.00.00 AM"  "9.00.00 AM" 
# [19] "10.00.00 AM" "11.00.00 AM" "12.00.00 PM" "1.00.00 PM"  "2.00.00 PM"  "3.00.00 PM" 
# [25] "4.00.00 PM"  "5.00.00 PM"  "6.00.00 PM"  "7.00.00 PM"  "8.00.00 PM"  "9.00.00 PM"

要删除NA，我们可以简单地使用na.omit

rep(na.omit(srcvec), len=30)
#  [1] "8.00.00 AM"  "9.00.00 AM"  "10.00.00 AM" "11.00.00 AM" "12.00.00 PM" "1.00.00 PM" 
#  [7] "2.00.00 PM"  "3.00.00 PM"  "4.00.00 PM"  "5.00.00 PM"  "6.00.00 PM"  "7.00.00 PM" 
# [13] "8.00.00 PM"  "9.00.00 PM"  ""            "8.00.00 AM"  "9.00.00 AM"  "10.00.00 AM"
# [19] "11.00.00 AM" "12.00.00 PM" "1.00.00 PM"  "2.00.00 PM"  "3.00.00 PM"  "4.00.00 PM" 
# [25] "5.00.00 PM"  "6.00.00 PM"  "7.00.00 PM"  "8.00.00 PM"  "9.00.00 PM"  ""

为了删除空白，我们可以在nzchar上进行筛选，当字符串继续使用一个或多个字符时，它返回true：

rep(Filter(nzchar, na.omit(srcvec)), len=30)
#  [1] "8.00.00 AM"  "9.00.00 AM"  "10.00.00 AM" "11.00.00 AM" "12.00.00 PM" "1.00.00 PM" 
#  [7] "2.00.00 PM"  "3.00.00 PM"  "4.00.00 PM"  "5.00.00 PM"  "6.00.00 PM"  "7.00.00 PM" 
# [13] "8.00.00 PM"  "9.00.00 PM"  "8.00.00 AM"  "9.00.00 AM"  "10.00.00 AM" "11.00.00 AM"
# [19] "12.00.00 PM" "1.00.00 PM"  "2.00.00 PM"  "3.00.00 PM"  "4.00.00 PM"  "5.00.00 PM" 
# [25] "6.00.00 PM"  "7.00.00 PM"  "8.00.00 PM"  "9.00.00 PM"  "8.00.00 AM"  "9.00.00 AM"

如果您有非空空格(例如，空格)，则可以使用以下内容：

srcvec <- c(srcvec, "   ")
rep(Filter(function(a) !is.na(a) & nzchar(gsub("\\s", "", a)), srcvec), len=30)
#  [1] "8.00.00 AM"  "9.00.00 AM"  "10.00.00 AM" "11.00.00 AM" "12.00.00 PM" "1.00.00 PM" 
#  [7] "2.00.00 PM"  "3.00.00 PM"  "4.00.00 PM"  "5.00.00 PM"  "6.00.00 PM"  "7.00.00 PM" 
# [13] "8.00.00 PM"  "9.00.00 PM"  "8.00.00 AM"  "9.00.00 AM"  "10.00.00 AM" "11.00.00 AM"
# [19] "12.00.00 PM" "1.00.00 PM"  "2.00.00 PM"  "3.00.00 PM"  "4.00.00 PM"  "5.00.00 PM" 
# [25] "6.00.00 PM"  "7.00.00 PM"  "8.00.00 PM"  "9.00.00 PM"  "8.00.00 AM"  "9.00.00 AM"

票数 1

Stack Overflow用户

发布于 2019-07-27 09:09:12

Time = paste(c(8:12,1:9),".00.00",sep = "")
PM_AM <- paste(Time,rep(c("AM","PM"),c(4,10)))
n_rep <- 5000 %/% length(PM_AM)
n_remain <- 5000 %% length(PM_AM)
x <- rep(PM_AM,n_rep)
x <- c(x,PM_AM[1:n_remain])

票数 1

Stack Overflow用户

发布于 2019-07-27 11:38:27

您可以使用github yikeshu0611中的onetree包来处理问题。

devtools::install_github("yikeshu0611/onetree")
library(onetree)

df=read_Text("
time PAM
8.00.00 AM
9.00.00 AM
10.00.00 AM
11.00.00 AM
12.00.00 PM
1.00.00 PM
2.00.00 PM
3.00.00 PM
4.00.00 PM
5.00.00 PM
6.00.00 PM
7.00.00 PM
8.00.00 PM
9.00.00 PM
")
nrow(df)
358 ≈ 5000/14

df是您的原始数据。然后我们将重复数358添加到df中。

df$n=358

最后，我们使用flat_strech对中的数据进行了n。

df2=flat_strech(data=df,strech="n")
nrow(df2)
5012

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/57230593

复制

相似问题

问列中序列的重复
EN

回答 4

Stack Overflow用户

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问列中序列的重复EN

回答 4

Stack Overflow用户

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问列中序列的重复
EN