下面的代码查找B列的任何字符串。是否可以循环遍历数据帧的多个列,输出包含每列字符串的单元格? import pandas as pd
for i in df:
print(df[df['i'].str.contains(r'^[a-zA-Z]+$')]) 链接到https://stackoverflow.com/a/65410078/12801962上的代码
我想使用for循环从R中的原始数据帧中创建几个数据帧。我想得到三个分离的数据帧为每种进行单独的分析。
我尝试了以下代码,但它不起作用:
data(iris)
library(dplyr)
for i in levels(iris$Species){
paste0(i,".data") <- data.frame(filter(iris,
Species=="i"))
}
我不一定需要dplyr,但这是我习惯的。
我有csv文件,我正在将其读入Python Pandas Dataframe。我想对操作进行矢量化,以便使用针对某些列的一组用户定义函数对列运行数据清理,并将结果附加到数据帧中。
我可以读取记录并逐个处理它们,但我想通过Pandas使用一个函数对1整列进行操作来向量化操作。
输入数据帧
A B C D
0 a b c d
1 t f h e
2 j r y k
我想在列A, B and C上执行数据清理(DC*)。
A B C D DC1-A DC2-B DC3-D
0 a b c d
? 我有一个数据帧,它将是100个项目的长度。我在网上找到的一个临时web模板上显示了这个数据帧(我不太了解html )。问题是,这个列表只会让你从1到100一直往下滚动,看起来非常糟糕。我希望有两列或三列并排(例如:一列中有33个项目,然后中间有33个项目,依此类推)这样数据帧就不会浪费太多空间。我不知道这是html的问题还是数据帧的问题,所以请原谅我。 我正在使用Flask作为web框架。 如果你需要我提供的html代码,我可以。 while counter < 50:
e = str(elem[counter].get_attribute("href"))
e
我有一个数据帧,如下所示: item width length
0 X 4 1
1 F 15 4
2 R 6 3
3 X 3 10
4 F 10 19 对于每一项,我想列出最长项的宽度和长度。我尝试使用df.groupby("item").max(),但它给出了以下数据帧,这是错误的: item width length
F 15 19
R
我有几个数据帧,其中一些列具有相同的名称。我试图想出一种方法,系统地从不同的数据帧中更改同名列的格式。以下是我想出的:
data1=data.frame(a=seq(1:10),b=c("a","b"))
data2=data.frame(a=seq(11:20),b=c("c","d"))
temp = c("data1$a","data2$a")
for (i in 1:length(temp)) {
eval(parse(text=(temp)[i])) = as.character(
我正在尝试找到一种在数据帧内进行搜索的方法,以返回多个条件的列和行引用。
#some data
SalesData<-data.frame(Appliance=c("Radio", "Laptop", "TV", "Fridge"), ThisYear=c(5,25,5,8), LastYear=c(6,20,5,8))
#code to find which row column TV is in which correctly gives row 3, col 1
TVRef<-which(SalesDat
我有15个数据框架,其中包含了一组病人的病人访问信息。下面的例子。他们被命名为FA.OFC1,FA.OFC2等。
ID sex date age.yrs important.var etc...
xx_111 F xx.xx.xxxx x.x x
我正在生成一个概要数据框架(sev.scores),其中包含了关于患者在所有记录数据中的最严重发作的信息。我已经成功地使用了which.max函数来获得最严重的插曲,但现在需要更多关于该特定插曲的信息。
我重新创建了数据框架的名称,需要在返回最大值后粘贴信息,以获得附加信息:
max
我正在寻找R中的解决方案,以找出一列/多列中的单词在数据帧的另一列中出现的次数。
我有一个DF有4列(页面,文本,野生动物和动物)。
df <- tibble::tibble(page=c(12,6,9,18,2),
text=c("Dogs are related to wolves, but dogs are friendly",
"I love pets",
"I like goat and deer. Deer
有办法系统地选择数据帧的最后一列吗?我希望能够将最后一列移动为第一列,但在它们被移动时保持它们的顺序。我需要一种不使用子集( data,select =c(在新顺序中列出的所有列)列出所有列的方法),因为我将使用许多不同的数据框架。
下面是一个示例,我想将最后2列移到数据帧的前面。很管用,但很难看。
A = rep("A", 5)
B = rep("B", 5)
num1 = c(1:5)
num2 = c(36:40)
mydata2 = data.frame(num1, num2, A, B)
# Move A and B to the front of
是否有办法使下面的R代码运行得更快(即矢量化以避免使用for循环)?
我的示例包含两个数据帧。首先是维度n1*p。其中一个p列包含名称。第二数据帧是列向量(n2*1)。它也包含名字。我希望保留第一个数据帧的所有行,其中第二个数据帧的列向量中的名称的某些部分出现在相应的第一数据帧中。很抱歉做出了残酷的解释。
示例(数据框架1):
x y
Doggy 1
Hello 2
Hi Dog 3
Zebra 4
示例(数据帧2)
z
Hello
Dog
所以在上面的例子中,我想保留行1,2,3,但不是4行,因为"Dog“出现在"Doggy”和&