我有一个数据文件:
ID Value
1 message "some text"
2 more messages "some more text"
我用下面的方式分隔数据帧中的一列:
df <- df %>%
separate(Value, c("message", "text"), ' "', remove = TRUE)
但我得到的是:
ID message text
1 message some text
def number():
for i in dataframe:
if i > 10:
print('large')
elif i <= 10:
print('small')
number()
small
small
large
small
有没有可能将这些值合并到DF中,特别是从方法中获得的值,比如上面的例子?
我正在尝试从数据帧中具有不同格式的一列地址中提取状态缩写。示例:
"123 Any St., Some City, IL 65234 United States"
"456 Any Other St That Town, CA 62626-1234 US"
我使用这个代码,它适用于具有5位邮政编码的字符串,但不适用于具有9位邮政编码的字符串:
df$state <- str_extract(df$address, "\\b[A-Z]{2}(?=\\s+\\d{5}$)")
我如何改变这一点,使其提取州,后跟5位和9位邮政编码?
我的清单是:
A B
1 Alex but
2 likes lala 54 hi
3 a lot number and 33 hello
4 of face soap 34 hello
5 food 35 hello
我想在B列的第一个数字之前提取单词串,并将它变成一个新的列,第C栏。我想要的输出是:
A B C
1 Alex but
2 likes lala 54 hi
我有一个包含如下文本行的dataframe:
ANTALYA (GB) ch. 1960
SHOOTIN WAR (USA) ch. 1998
LORD AT WAR (ARG) ch. 1980
所有的大写都是名字,然后是()中的位置,颜色缩写,年份。名字可以是多个单词。我想把这个单一的文本块分成每个组件:名称、位置、颜色、年份。我已经和这个斗争了好几天了,最好的解决办法就是把每个词都放在单独的列里,但是只有当名字都有一定的长度时,它才能起作用。对于我所做的数据,我可以用它的形式,但它只是看起来不太好,你知道吗?
sepdf <- df %>%
在我的数据中,我有一列打开的文本字段数据,类似于以下示例:
d <- tribble(
~x,
"i am 10 and she is 50",
"he is 32 and i am 22",
"he may be 70 and she may be 99",
)
我想使用regex将所有两个数字提取到一个名为y的新列中。我有以下代码,它可以很好地提取第一个匹配项:
d %>%
mutate(y = str_extract(x, "([0-9]{2})"))
# A tibble: 3 x 2