使用虚拟数据,我有两个数据帧:
一个是按性别分隔的位置及其排名的列表(df1)
Locations Male Female
1 A 1 2
2 B 2 1
3 C 1 2
另一个是人员列表
Name Gender Location
1 Joe Male A
2 Alex Female B
3 Chris Female A
4 Sam Male C
我想在第二个数据框(df2$Value)中添加一列,根据性别和位置为第
我已经尝试了一段时间,在我的数据集的第一个观察值和199个观察值中的其余观察值之间进行回归。我使用了lapply函数,回归结果以列表的形式存储在环境中。我的目标是只获取p_values列表作为数据帧,并确定有多少观测值小于0.05。任何帮助都将不胜感激! ## Here are the code I am using right now.
myre1 <- apply(2:ncol(muscle), function(x) lm(muscle[,1] ~ muscle[,x], data = muscle))
myre2 <- lapply(muscle[,-1], functi
假设我有一个类似于下面的列表: l = ['A','B','C','D','E','F','G','H','I','L','M','N'] 我想创建一个有4列的数据帧,因为列表中每4个对象就是一行。结果应该是具有以下形式的数据帧: Col1 Col2 Col3 Col4
A B C D
E F G H
I
我正在处理两个数据帧,A和B。数据帧A是用值填充的,而数据帧B是空的,除了报头结构。我想取数据帧A中的列的值,并将它们附加到数据帧B的相应列中。 我已经将dataframe A列的值放到了一个列表中。我尝试将目标列值设置为与起始列值列表相等,但出现了以下错误: dataframeB[x] = list(dataframeA[A]) 这会产生以下错误: ValueError: Length of values does not match length of index 我预期结果是Dataframe A的列A转移到Dataframe B的列x A B C D
1 2 3
我在一个数据帧中创建了15行,如下所示。我不能展示我的真实代码,但是create row函数涉及可以放在函数中的复杂计算。关于如何使用lapply、apply等并行创建所有15行,然后将所有行连接到一个数据帧中,您有什么想法吗?我认为使用lapply是可行的(例如,将所有行放在一个列表中,然后取消列表并连接,但不确定如何操作)。 for( i in 1:15 ) {
row <- create_row()
# row is essentially a dataframe with 1 row
rbind(my_df,row)
}
我已经在Pandas中通过df.describe()获得了我的数据帧的统计数据。
statistics = df.describe()
我想根据计数过滤统计数据帧:
main Meas1 Meas2 Meas3 Meas4 Meas5
sublvl Value Value Value Value Value
count 7.000000 1.0 1.0 582.00 97.000000
mean 30 37.0 26.0 33.03 16.635
假设您有一个函数数组。每个函数返回一个具有相同索引和大小的pandas.Series对象。每个函数都接受相同的输入,即主数据df。
我正在寻找一个输出,该输出将本系列的每一项都作为结果数据帧的列。
目前,我有以下几点:
df_result = [f(df) for f in f_arr]
df_result = pd.DataFrame(df_result)
这需要很长时间(列表操作似乎有一些开销),由此产生的数据就是我所需要的转换。我觉得应该有一个干净的地图/应用的方式来做到这一点。
我有一个数据帧,它具有唯一的行名和唯一的列名。我想将行转换为列,并将列转换为行。
例如,下面的代码:
starting_df <- data.frame(row.names= c(LETTERS[1:4]),
a = c(1:4),
b = seq(0.02,0.08,by=0.02),
c = c("Aaaa","Bbbb","Cccc","Dddd")
我有以下在熊猫数据帧上工作的函数 def event_list(df,steps):
df['steps_present'] = df['labels'].apply(lambda x:all(step in x for step in steps))
return df DataFrame有一个名为labels的列,值为list。此函数接受dataframe和Steps (这是一个列表),如果参数列表中的所有元素都存在于dataframe列中,则输出具有新列Steps的dataframe value in df['labels
我想创建一个函数,它接受两个名为键和值的列表作为参数,并返回一个数据帧,example:create_dataframe("One"," two ",["X","Y","A","B"]) ->应该返回一个数据帧 One Two
0 X A
1 Y B 出于这个目的,到目前为止(我正在学习)我已经使用了下面的代码,但是结果只显示了Zero,有人能指导我哪里错了吗? import pandas as pd
def create_dat
我有一个数据帧列表,我希望将该列表中每个数据帧的摘要统计信息返回到一个新的数据帧中-能够选择每个初始数据帧中的列(值)来返回摘要统计信息。输出数据帧中的每一行对应于初始列表中的每个数据帧。 我可以使用for循环获得汇总统计信息输出,但它只会给我列表中最后一个数据帧的汇总统计信息,而不是列表中的所有数据帧。下面是一个for循环示例,它为我提供了列表中最后一个数据帧的输出统计信息。 for i in step2:
step3=i.describe() #gives me a single df of the last item (dataframe) in my list 下面是我的列表
我有以下代码,用于使用csv文件创建数据框字典:
l = ['employees','positions']
d = {}
for x in l:
d[x] = pd.read_csv("P:\\python_work\\data_sets\\" + x + ".csv")
如何使用内存中已有的数据帧列表执行相同的操作?
这不起作用,但也许它有助于弄清楚我想要做什么:
l = ['df1','df2']
d = {}
for x in l:
d[x] = x
然后,我可以像这样访问单