我有一个数据帧列表,我希望将该列表中每个数据帧的摘要统计信息返回到一个新的数据帧中-能够选择每个初始数据帧中的列(值)来返回摘要统计信息。输出数据帧中的每一行对应于初始列表中的每个数据帧。 我可以使用for循环获得汇总统计信息输出,但它只会给我列表中最后一个数据帧的汇总统计信息,而不是列表中的所有数据帧。下面是一个for循环示例,它为我提供了列表中最后一个数据帧的输出统计信息。 for i in step2:
step3=i.describe() #gives me a single df of the last item (dataframe) in my list 下面是我的列表
我有两个数据帧。
data frame 1 includes : ID, date1, date2
data frame 2 includes : ID, date , amount
我想在数据帧1中创建另一个列,它汇总了数据帧2中date1和date2之间的数量,以及数据帧1中的match ID。
我尝试了一些使用dplyr的方法,包括使用lubridate在数据帧1中创建一个间隔列,但仍然无法解决。
另外,我需要指出的是,数据框2中的每个ID都有多个列表,每个ID在一个月内每天都有相应的金额。这就像excel中的sumifs函数,但对于R,如果id匹配,日期是btw、date1和date2
我有一个数据帧,其中第一列包含活动的名称。我需要汇总所有活动名称包含特定字符串的行(它可以出现在名称中的不同位置,即有时出现在开头,有时出现在结尾)。数据帧如下所示:
Campaign Impressions
1 Local display 1661246
2 Local text 1029724
3 National display 325832
4 National Audio 498900
5 Audio local 597339
6 TV Regional 59
卸载后的数据帧具有多个行,这些行的na值可以汇总到一行中。所有文本/字符数据。示例:
link feature-1 feature-2 feature-3
link_1 a. NA NA
link_1. NA NA b
link_1. NA. c NA
link2 NA. a NA
link_2 NA NA d
link_2 x NA NA
我有一个关于根据other列的总和创建pandas数据帧的问题。
例如,我有这样的数据帧
Country | Accident
England Car
England Car
England Car
USA Car
USA Bike
USA Plane
Germany Car
Thailand Plane
我想制作另一个基于国家/地区的所有事故总和的数据帧。我们将忽略事故的类型,而根据
在进行聚类分析时,有一个数据帧,其中包含一堆不同的属性列和一个用于聚类标签的列。需要对这些数据进行汇总。
执行groupby sum操作,这是我想对dataframe中的多个列执行的操作,需要将生成的tibble存储在一个列表中,最后将它们放在一起作为一个dataframe。
datalist = list()
for (i in 5:15){
dat = df %>%
group_by(cluster) %>%
summarise((colnames(df)[i]) = (sum(colnames(df)[i])))
我使用的数据帧有一个名为"NUM_EMPL“的列,它存储特定公司的员工数量。
正如您在中看到的,这些单元格包含字符串。
现在我已经写了一段代码,它可以汇总该列的一个特定单元格:
list = buildings.loc[61, 'NUM_EMPL'].split(', ')
int_list = [float(i) for i in list]
print(sum(int_list))
现在,我想对每个单元格执行此操作,并将每个单元格的总和存储在一个新的数据帧中。
如何遍历单元格?
我还处在python的学习阶段,我想知道如何在一个名为 count 的列中汇总数据并计数重复的数据行。
数据帧结构如下
Col1| Value
A | 1
B | 1
A | 1
B | 1
C | 3
C | 3
C | 3
C | 3
我的结果如下
Col1|Value|Count
A | 1 | 2
B | 1 | 2
C | 3 | 4