我正在使用R.读取一个PDF文件,我希望以这样一种方式转换给定的文本,即每当检测到多个空格时,我希望用一些值(例如"_")替换它们。我遇到了一些问题,在这些问题中,所有1或更多的空格都可以使用"\s+“()替换,但这对我来说是行不通的。我有一根看起来像这样的绳子;
"[1]This is the first address This is the second one
[2]This is the third one
我刚刚开始使用R,目前正在尝试创建一个条形图,显示每个“类别”被使用的次数。这些类别包括旅游、活动和体育等。我尝试了一些出现错误的方法
barplot(freq, main = category) +geom_bar(stat=category)
Error in as.graphicsAnnot(main) : object 'category' not found
ggplot(data=dat, aes(category))
Error in ggplot(data = dat, aes(category)) : object 'dat' not fou
MOst搜索结果给出了相反的结果,将NULL或NA转换为字符串'NA‘。我不想这样,我想把'NULL‘的字符串实例转换为NA,但是我得到了一个错误:
bla <- c('foo', 'bar', NA, 'NULL')
str_replace_all(bla, 'NULL', NA)
Error: `replacement` must be a character vector
也曾尝试过:
str_replace_all(bla, 'NULL', NA_real_)
Error: `rep
我想要生成一个数据文件hminput,其中包含来自不同的较小数据(名为frqAFR、frqAMR、..。等等,如下所示)。因此,与其单独编写所有代码来提取每个列的三列,然后按列绑定它们,然后再按行绑定,我想知道是否可以使用列表中包含字符串的for循环对其进行一些优化。
所以,到目前为止,我的想法是:
listpop<-c("frqAFR","frqAMR","frqEUR","frqEAS","frqSAS","frqAFROURU","frqIND")
for (g in
对于如何以地图指定的方式在字符串中重新映射字母,我将不胜感激。
假设,例如,我想将所有关于Bs,所有Bs更改为Ds,将所有Ds改为Fs。如果我这样做,它就不会做我想做的事情,因为它先后应用了转换:
"abc" %>% str_replace_all(c(a = "b", b = "d", d = "f"))
我可以做我想做的事,但感觉有点笨重。
f <- function (str) str_c( c(a = "b", b = "d", c = "c", d = "
全名(和标题等)通常需要将行分隔为多个列,以便按“姓氏”字母顺序对行进行排序。当单个列包含全名时,我从未遇到过在SQL中实现这一目标的简单方法。
然而,我知道R有成千上万的库--虽然我没有遇到任何例子,可以做到这一点,而不把名字、姓氏和标题分开到它们各自的列中--我想我可以看看是否有一种更有效的方法来处理这种情况。
我使用的数据集只有一个列,其全名为,名为。例如:
Names
1 Robert Johnson
2 Billy Joel
3
我有数据集,有一些奇怪的字符串,像这样
ID State
1 NA
2 IL
3 IL,IL,IL
4 OH,IL
5 NM,NM,AL,AL
6 FL,FL,FL
我喜欢
如果状态值是两种不同的状态,则用NA替换状态值,如果状态值相同但重复,则用唯一值替换状态值。
预期数据集
ID State
1 NA
2 IL
3 IL
4 NA
5 NA
6 FL
我试过paste(unique(df$State), collapse=
我有很多类似于此的信息:
dftest_tw <- structure(list(text = c("RT @BitMEXdotcom: A new high: US$500M turnover in the last 24 hours, over 80% of it on $XBTUSD. Congrats to the team and thank you to our u…",
"RT @Crowd_indicator: Thank you for this nice video, @Nicholas_Merten",
"RT @Crow
我有一个datatable,如下所示
> head(mydt)
name b c
1: ao 2 1 GiB
2: bo 2 1.4 Gib
现在,我试着做一些清理-我试图从c列的值中删除这个单元,而没有任何循环。我做了以下工作:
mydt[,4 :=substr(c,0,gregexpr(pattern=' ',c)[[1]][1]-1)]
我得到的是这样的东西:
> head(mydt)
name b c
1: ao 2 1 G
2: bo 2 1.4
我有一个数据帧,它具有唯一的行名和唯一的列名。我想将行转换为列,并将列转换为行。
例如,下面的代码:
starting_df <- data.frame(row.names= c(LETTERS[1:4]),
a = c(1:4),
b = seq(0.02,0.08,by=0.02),
c = c("Aaaa","Bbbb","Cccc","Dddd")
我有一个像这样的数据文件:
value id
1 2 A
2 5 A
3 NA A
4 7 A
5 9 A
6 1 B
7 NA B
8 NA B
9 5 B
10 6 B
我想用id变量来计算这个值的增长率。通常,我会这样做:
df <- df %>% group_by(id) %>% mutate(growth = log(value) - as.numeric(lag(value)))
为了获得这个数据:
value id growt