考虑以下data.frame:
df <- data.frame(ID = 1:3, Name = c("Xiao-Li Meng, Michael Drake, Jennifer Chayes, Chayes, Michael Jordan, John DeNero, Ani Adhikari, Jordan, Mia Scher", "Nenshad Bardoliwalla, Bardoliwalla, Alex Woodie", "Jill McKeon, Jan Nygaard Jensen, Hongyu Zhao, Xinxin (K
在R中,我将一个ngram为4的DocumentTermMatrix转换为一个dataframe,现在我想将ngram分成两列,一个列包含字符串的前3个字,另一个列为最后一个字。我可以通过多个步骤来完成这一任务,不过,考虑到我希望在网上完成的df的大小,我可以做到这一点。
以下是我想要完成的任务:
# str_name w123 w4 freq
# 1 One Two Three Four One Two Three Four 10
这给了我前三个词:
df <- data.frame(str_name = "
我有两个大的和小的数据帧(实际上数据集非常非常大!)。下面的内容只是为了工作。
big <- data.frame (SN = 1:5, names = c("A", "B", "C", "D", "E"), var = 51:55)
SN names var
1 1 A 51
2 2 B 52
3 3 C 53
4 4 D 54
5 5 E 55
small <- data.frame (names = c("A",
我得到了一个数据框 a <- c('A','A','A','A','B','B','C','C')
b <- c(1,2,1,3,1,3,1,6)
c <- c('K','K','H','H','K','K','H','H')
frame <- data.frame(a,b,c)
> frame
a b
test.data <- data.frame(summary = c("Execute commands as root via buffer overflow in Tooltalk database server (rpc.ttdbserverd)."
,"Information from SSL-encrypted sessions via PKCS #1."
,"ip_input.c in BSD-deriv
我想在数据帧中将城市与区域相匹配。列有点混乱,所以我想提取两个列中出现的城市/区域的名称,如下例所示。
A <- c("Berlin",
"Hamburg",
"Munich",
"Stuttgart",
"Rhein Main Frankfurt",
"Hannover")
B <- c("Berlin Brandenburg",
这提供了h1标记中的文本。
library(rvest)
df1 <- data.frame(id = c(1,2), text = c("<h1> Title </h1> keep me here <h1>not </h1> or <h2> else</h2>","also not here <h1> but</h1> here also")
rawHTML <- paste(df1$text[1], collapse="\n")
raw
假设我创建了以下data.frame:
f <- c("a",2,3,8,7)
g <- c("b",4,1,8,14)
h <- c("abc",7,3,1,4)
i <- c("a",2,3,8,4)
df <- data.frame(f,g,h,i)
我如何通过要求R删除第一行中没有“a”的列来删除g和h列(在示例中,只保留f和i )?
虽然这可能是显而易见的,但我无法理解或找到类似的东西(我发现类似的问题是,人们没有他们正在寻找的变量或值,或者错误报告了更复杂的操作。这与我的数据集的规模有关系吗?
我的相关代码是:
MaOnly <- NfirsManipulatedNfirsManipulated$ == MA
Error in `[.data.frame`(NfirsManipulated, NfirsManipulated$STATE == MA, :
object 'MA' not found
摘要(NfirsManipulated$STATE)
AK AL AR
我想将data.frame中的变量名从"pmm_StartTimev4_E2_C19_1“更改为"pmm_StartTimev4_E2_C19”。因此,如果名称以下划线结尾,后面跟着任意数字,则它将被移除。
但是,我希望只有当变量名在中包含单词“”时,才会发生这种情况。
我有一些乱七八糟的代码不起作用。任何帮助都将不胜感激!
# Current data frame:
dfbefore <- data.frame(a=c("pmm_StartTimev4_E2_C19_1","pmm_StartTimev4_E2_E2_C1",