基于多列的数据帧汇总_基于多列匹配的多数据帧合并_基于多列的Spark join 2数据帧 - 腾讯云开发者社区

python、pandas、dataframe

我每5分钟就有一个包含传感器数据的巨大数据帧。我在一周数栏中添加了。我想要按周汇总日光传感器列，但想要平均温度列(if temp > 0)。 ClimateDF.groupby('week').agg({'sunlight': 'sum', 'Temp': 'mean'}) 这是可行的，但是我该如何添加条件呢？例如，仅对temp、if temp > 0等求平均值？

浏览 13提问于2019-09-14得票数 0

2回答

获取列表中嵌套数据帧的汇总统计信息

python、list、dataframe

我有一个数据帧列表，我希望将该列表中每个数据帧的摘要统计信息返回到一个新的数据帧中-能够选择每个初始数据帧中的列(值)来返回摘要统计信息。输出数据帧中的每一行对应于初始列表中的每个数据帧。我可以使用for循环获得汇总统计信息输出，但它只会给我列表中最后一个数据帧的汇总统计信息，而不是列表中的所有数据帧。下面是一个for循环示例，它为我提供了列表中最后一个数据帧的输出统计信息。 for i in step2: step3=i.describe() #gives me a single df of the last item (dataframe) in my list 下面是我的列表

浏览 8提问于2019-09-14得票数 0

回答已采纳

1回答

动态汇总和重命名PySpark中的聚合列

python、apache-spark、pyspark、apache-spark-sql、data-manipulation

我有一个PySpark数据帧(Df)，其中包含50+列，其中包含一些动态列，这些列可能存在也可能不存在，但它们存在于一个单独的列表(Reqd_col)中。我想对列表(Reqd_col)中存在的PySpark data frame(df)中的那些列进行汇总(按固定列‘region’分组)和汇总总和或计数，汇总列的名称应与列的原始名称相同，而不是PySpark生成的默认名称。以下是一个例子： df- PySpark数据帧，由50+列组成 Reqd_Col = 'Amount'，'Balance'，'Customer‘-->这是一个不断变化的动态列表

浏览 24提问于2021-09-08得票数 0

2回答

R-2数据帧，数据帧2上数据帧1的日期之间的总和值与ID#匹配

r、lubridate、sumifs、dplyr

我有两个数据帧。 data frame 1 includes : ID, date1, date2 data frame 2 includes : ID, date , amount 我想在数据帧1中创建另一个列，它汇总了数据帧2中date1和date2之间的数量，以及数据帧1中的match ID。我尝试了一些使用dplyr的方法，包括使用lubridate在数据帧1中创建一个间隔列，但仍然无法解决。另外，我需要指出的是，数据框2中的每个ID都有多个列表，每个ID在一个月内每天都有相应的金额。这就像excel中的sumifs函数，但对于R，如果id匹配，日期是btw、date1和date2

浏览 0提问于2018-04-18得票数 0

2回答

摘要命令不生成摘要统计信息

r、lm、summary、plm

summary(dataframe1)命令为我提供了该数据帧的汇总统计信息，如max、min和NA的数目。类似地，summary(dataframe1$column1)为数据框架内的特定变量(其列之一)提供了汇总统计信息。在我使用lm和plm运行一些回归之前，以及每当我试图通过dataframe1通过summary(dataframe1$column1)获取数据帧中的列的简要统计信息之前，这是很好的工作。我得到的输出是“平方和”、"id“和”时间“。这一切为什么要发生？dataframe1不是我的回归模型的名称，但我确实使用dataframe1作为这种回归模型的数据源。如何强制汇总

浏览 20提问于2022-02-28得票数 0

回答已采纳

3回答

使用dplyr的summarise_each为每个函数返回一行？

r、dplyr

我正在使用dplyr的summarise_each将一个函数应用于多个数据列。一件很好的事情是你可以一次应用多个函数。问题是，令人恼火的是，输出是一个只有一行的数据帧。它似乎应该返回与函数一样多的行，以及与汇总的列一样多的列。 library(dplyr) default <- iris %>% summarise_each(funs(min, max), matches("Petal")) 这将返回 > default Petal.Length_min Petal.Width_min Petal.Length_max Petal.Widt

浏览 91提问于2015-01-11得票数 20

回答已采纳

1回答

Python:转置和分组数据帧

python、pandas、aggregate、transpose

我有数据帧: table_revenue 如何转置数据帧并按'stations_id‘分组以查看最终结果，如：其中，单元格值是价格，按特定'station_id‘(行)的确切日期(列)汇总

浏览 0提问于2020-11-07得票数 0

1回答

Panda的合并返回空，看不到原因

python、pandas、join、merge

我有以下数据帧：然后，我通过列'Dia‘汇总了值'Hp’，使用以下语法获得了以下数据集： df_Sum=df.groupby(df.Dia.dt.date)['Hp'].sum() 并获得以下时间序列(稍后我需要将to_frame()转换为合并)：我想要做的是，将每天的汇总值复制到与原始数据帧匹配的每天(在那里，日期“Dia”可以重复，见第一张图像)。最后，我希望第一个数据帧中的每个不同字段类型date 'Dia‘都有自己的值汇总，所以我选择了下面的合并语法： pd.merge(left=df,right=df_Sum.to_f

浏览 0提问于2017-07-16得票数 1

回答已采纳

3回答

如何对熊猫中具有布尔数据类型的变量执行.describe()方法

python、pandas

我试图获得数据帧列的汇总统计信息，数据类型为: Boolean。当我运行：df.describe()时，它只提供数值(在本例中为浮动)数据类型的汇总统计信息。当我将它更改为df.describe(include=['O'])时，它只提供对象数据类型。在这两种情况下，都不提供布尔数据类型的汇总统计信息。任何建议都是非常感谢的。谢谢

浏览 5提问于2018-01-13得票数 3

回答已采纳

2回答

如何对包含数组的列求和

python、arrays、pandas、dataframe、sum

我有一个问题来总结每个单元格中包含数组的数据帧的列。我尝试使用df.sum()对列进行汇总，希望得到总的列数组，例如4,1,1,4,1，列'common‘。但我只得到了一个空的序列。 df_sum = df.sum() print(df_sum) Series([], dtype: float64) 在这种情况下，如何获取汇总列？

浏览 0提问于2019-06-15得票数 1

1回答

如何将摘要输出转换为数据框？

r、dataframe

我汇总了由ID组成的数据框(称为此数据)的一列，因此我得到了给定列中每个ID的总数。我想将其转换为另一个数据框(称为TOTALNUM)，因此我有两列。第一列是ID本身，第二列是每个ID的总数。这可能吗？示例数据： ids <- c(1,2,3,4,5,1,2,3,1,5,1,4,2,2,2) info <- c("A","B","C","A","B","C","A","B","C","A","B","

浏览 0提问于2013-06-22得票数 9

回答已采纳

1回答

在Shiny中构建dplyr功能的交互式版本

r、dplyr、shiny

我正在构建一个闪亮的应用程序，处理用户选择的多个文本文件。输出是一个具有数百万行和数十列的巨大数据帧。我现在感兴趣的是允许用户交互式地筛选行、选择列和汇总列(通过从mean、sd、max、min、sum等函数列表中进行选择)。结果将是一个较小的数据框架，汇总每个用户选择的数据-基本上，我需要创建一个GUI来实现dplyr库的基本功能。一般来说，我知道如何手动创建一组GUI元素，并使用许多dplyr命令将它们提供给服务器函数。因为这似乎是一个非常标准的功能(过滤和汇总数据帧的GUI)，所以在我开始从头开始构建它之前，我想知道是否有什么“现成的”可以使用，或者作为我的起点。

浏览 0提问于2016-09-06得票数 0

1回答

删除多级列透视表python

python

我有一个数据透视表，在列的名称中有一个多索引，如下所示：我希望保持相同的数据是正确的，但我想为汇总所有索引的每一列指定一个名称，如下所示：

浏览 0提问于2019-06-20得票数 0

3回答

对R中包含特定字符串的行求和

r、plyr

我有一个数据帧，其中第一列包含活动的名称。我需要汇总所有活动名称包含特定字符串的行(它可以出现在名称中的不同位置，即有时出现在开头，有时出现在结尾)。数据帧如下所示： Campaign Impressions 1 Local display 1661246 2 Local text 1029724 3 National display 325832 4 National Audio 498900 5 Audio local 597339 6 TV Regional 59

浏览 0提问于2015-01-30得票数 0

2回答

如何将所有共享相同url的行放入1行？

r、dataframe、dplyr

卸载后的数据帧具有多个行，这些行的na值可以汇总到一行中。所有文本/字符数据。示例： link feature-1 feature-2 feature-3 link_1 a. NA NA link_1. NA NA b link_1. NA. c NA link2 NA. a NA link_2 NA NA d link_2 x NA NA

浏览 0提问于2021-04-08得票数 0

1回答

将Python Groupby和aggregate转换为Postgres SQL

pandas、postgresql、dataframe、pandas-groupby

假设我的PostgresSQL数据库中有一个名为cnms_table的表，它等同于我在Python脚本中创建的一个名为cnms_df的熊猫数据帧。在Python dataframe中，我能够使用groupby和agg根据特定的列/字段对数据帧进行汇总和聚合，从而创建一个名为sum_df的新汇总数据帧。 sum_df_prelim = cnms_df.groupby(['Region', 'State', 'CO_FIPS', 'Tiermetric_Prelim',

浏览 16提问于2021-10-11得票数 0

回答已采纳

2回答

对R中的多个数据帧进行汇总统计

r、statistics

如果这个问题在其他地方得到了回答，我深表歉意。我希望在R中跨多个数据帧计算和输出汇总统计信息。对于上下文，我的数据存储在每个主题的.txt文件中-只有一列: 63个obs，共1个变量。我总共有48个文件，对应于48个主题。我将这些文件读取到Rstudio中，并使用以下脚本创建了多个每个主题的数据帧： filenames <- gsub("\\.txt$","", list.files(pattern="\\.txt$")) for(i in filenames){ assign(i, read.delim

浏览 7提问于2020-05-25得票数 0

1回答

python大熊猫无法显示大型数据摘要

python、pandas、dataframe、data-analysis

最近我升级到了熊猫版本0.13，并且遇到了这样的问题:无论我的数据集有多大(最大的一个有25列和158430行)，熊猫都会打印出整个数据格式(不是全部，每列只有几行，但仍然很乱！)而不是打印出汇总表，在这样大的数据帧的情况下，汇总表要干净得多。我只是想知道是否有其他人有这个问题，或曾经有过这个问题，并知道如何解决它。提前感谢！

浏览 3提问于2014-02-12得票数 2

回答已采纳

2回答

基于另一列计算值的出现次数

python、pandas

我有一个关于根据other列的总和创建pandas数据帧的问题。例如，我有这样的数据帧 Country | Accident England Car England Car England Car USA Car USA Bike USA Plane Germany Car Thailand Plane 我想制作另一个基于国家/地区的所有事故总和的数据帧。我们将忽略事故的类型，而根据

浏览 0提问于2016-09-21得票数 3

回答已采纳

0回答

R Shiny:在反应式数据框架中创建新列

r、shiny、reactive、cbind

假设我有一个名为summarized的数据框架，其中包含列TY_COMP和LY_COMP (以及其他列)。我可以用R编写一个函数，对TY_COMP和LY_COMP执行计算，并在数据框中创建一个名为cac的新列，如下所示： summarized$cac <- summarized$TY_COMP/summarized$LY_COMP-1 cac现在是汇总数据框中的新列。现在假设summarized()是一个具有相同列的反应式数据帧。我如何实现在非反应性数据帧中所做的效果，即在当前帧中创建新列？或者我怎样才能得到同样的效果呢？我试过了： summarized$cac <- rea

浏览 0提问于2017-12-14得票数 3

回答已采纳

2回答

列表中所有数据帧中一列(同名)的和

r、list、dataframe、sum

如何将列表中所有数据帧中的特定列和起来，并将它们放入新的数据框架中？一个小例子是： A <- data.frame(matrix( nrow = 2, ncol = 2)) B <- data.frame(matrix( nrow = 2, ncol = 2)) A[,] <- 3 B[,] <- 4 l <- list(A,B) 因此，假设我想对列表中的所有列"X1“进行汇总，并放入一个数据框架(向量，因为应该只有一行)。然后，这个数据帧的值应该是第一行的值6 (3+3)，第二行的值是8 (4+4)。在实际数据中，列表中有18个数据帧，每个数据帧中

浏览 0提问于2019-06-20得票数 0

回答已采纳

2回答

如何将唯一的重复列折叠为R中的唯一列？

r、dplyr

溶液我带着下面的“毛里塔尼亚”和“akrun”提供的解决方案。问题对于数据帧，我只想保留每组重复列中的1列。此外，保留的列采用的名称是重复列集中所有列名的连接。数据帧中有多组重复列。数据框架包含数以万计的列，因此使用for循环可能会花费太多时间。我已经尝试了使用重复()、汇总()、聚合()、lapply()、combination ()和the for循环的组合。输入数据帧(df_in)： 0 1 2 3 4 5 6 7 0 1 0 0 1 0 1 1 0 1 0 1 1 0 0 0 1 0 1 0 0 1 1 0 输出数据帧(df_out)： 0-2-5 1-4 3 6 7 0

浏览 1提问于2019-04-13得票数 0

回答已采纳

1回答

如何使用dplyr汇总分组数据中的级数(n级)？

r、dplyr

在分组之后，我想使用dplyr中的汇总函数来提取数据帧中每个变量的层数。以下是数据帧的副本： x=c("A","A","A","A","A","B","B","B","B","C","C","C","D","D","D","E","E") y=c("a","b","c","

浏览 5提问于2017-12-22得票数 1

4回答

带汇总r的逻辑值计数

r、dplyr、grouping、summarization

在数据帧中，我有一个具有Y和N值的列。这个数据帧也有一个id列。我想要创建两个列，一个具有总Y计数，另一个具有每个id的总N计数。我尝试用dplyr汇总函数执行这个过程。 group_by(id) %>% summarise(total_not = count(column_y_e_n == "N"), total_yes = count(column_y_e_n == "Y") 但是反对错误消息 Summarise_impl中的错误(.data，dots) 有服用吗？

浏览 0提问于2019-02-16得票数 1

回答已采纳

1回答

pandas group_by dataframe在写入excel时只输出聚合列；如何在excel上获得全部输出？

python、pandas、dataframe、data-wrangling

我正在尝试对数据帧中的特定列进行分组和汇总，然后将整个输出写入excel；但是，当我在使用以下代码后检查excel文件时，它只包含一个聚合列作为输出，而不包括任何其他分组。我是有人可以帮助我纠正代码或提供建议，如何实现这一点？提前感谢！ my_df = pd.DataFrame(df.groupby(['Parent Category','Expense'])['Parent Category','Expense','Variance'].sum()) ? 接下来，我使用下面的代码将其写入excel，但它

浏览 24提问于2020-04-24得票数 0

回答已采纳

2回答

熊猫群并聚集到新的栏中

python、pandas、pandas-groupby

目前，我正在尝试将一列转换为几个列，并相应地对其内容进行汇总，即整理数据帧的长度。例如，我们有一个名为year的专栏，其值从2014年到2016年不等。其次，我们还有一个金额为sales的列。我想要的是将year转换为2014，2015 & 2016，其中包含与特定年份相对应的sales之和。原始的sales可以被删除，或者显示所有年份销售总额的总和。使用Pandas ()函数、agg()和transform()，我尝试提出了一个解决方案，没有流行的，。也就是说，我似乎无法找到创建2014等列的解决办法。假设使用以下数据帧： df = pd.DataFrame({'Cust

浏览 0提问于2019-08-16得票数 2

回答已采纳

1回答

keras:如何将帧级预测聚合为歌曲级预测

python、tensorflow、keras、deep-learning、audio-processing

我在做一首歌的分类。对于每首歌，我都把它们切成小帧(5s)，作为神经网络的输入特征生成谱图，并且每个帧都有一个相关的歌曲类型标签。数据如下所示： name label feature .... song_i_frame1 label feature_vector_frame1 song_i_frame2 label feature_vector_frame2 ... song_i_framek label feature_vector_framek ... 我可以在没有问题的情况下，从Keras获得每一帧的预测精度。但

浏览 0提问于2018-12-20得票数 0

回答已采纳

2回答

总结数据帧集合-改进笨拙的解决方案

r、dataframe、summarize

我有一个数据框集合df_i，表示一组患者对医院的第i次访问。我想总结一下每个数据框，以确定第i次就诊时的男性、女性和患者总数。虽然我可以解决这个问题，但我的解决方案很笨拙。有没有更简单的方法来获得我想要的最终数据帧？示例如下：我希望生成以下结果：我可以用一种非常笨拙的方式来做这件事:首先创建一个临时数据框，它以df_1格式汇总信息接下来，对df_tmp中的每一列求和，以创建汇总列的第一行。对第二个和第三个数据帧重复上述步骤。最后，将行重新绑定在一起以创建汇总数据框架。虽然这种方法有效，但它非常笨拙，并且不适用于访问次数可变的情况。有没有人能给我指个更优雅的方法来解决我的问题？在此，

浏览 43提问于2021-02-28得票数 0

回答已采纳

1回答

如何进行左连接，其中"data B“中的行与id所在的行不同？

我有一个包含两列的数据框"A“，第一列是城市名称(唯一值)，第二列是NA，我想用失业数据填充它。数据框"B“有一列城市名称，但失业数据不在同一行，准确地说，它总是在下面1行。如何合并这两个数据，以便R查看数据帧"A“上的第一列，找到它在数据帧"B”上的匹配，并将数据帧"A“的第二列中的NA替换为匹配行下面的值1行。以下是数据帧A和B外观的一些汇总版本。 names= c("Bogotá", "Medellín") data_frame_A= as.data.frame(names, ncol=1) colnames(

浏览 1提问于2019-04-23得票数 0

1回答

从头开始设置特定的多索引

dataframe、indexing、multi-index

我的任务如下:我需要从头开始以数据帧的形式构建几个表。具体地说，每个标识符的每个表都是相同的(一种汇总统计表)。例如： <code>A0</code> 结果给了我这个结果： <code>A1</code> 我有一个计算那里使用的所有值的函数，最后它从一个值字典中创建了上面给出的数据帧。我需要能够设置一个由两个部分组成的多索引:第一个(或外部)是标识符(比如'Roger')，第二个(或内部)是我已有的内容，即列表<code>D2</code>。结果应该如下所示： <code>A3</code

浏览 8提问于2020-03-13得票数 0

回答已采纳

2回答

python pandas dataframe添加相同的行值

python、pandas

我有一个数据帧，看起来像这样： Fruit Quantity orange 4 grape 2 apple 3 grape 2 orange 1 我想根据水果列中相同的项目名称对数量列进行汇总。期望的结果是： Fruit Quantity orange 5 apple 3 grape 4

浏览 0提问于2021-11-01得票数 0

2回答

如何为分组中的每一列创建多个汇总统计信息？

python、pandas、grouping

使用groupby().agg()可以计算指定列的汇总统计信息。但是，如果我想为每组数据帧的每一列计算“min”、“max”和“mean”，该怎么办？有没有办法让pandas自动为每个列名附加一个前缀？我不想枚举agg()函数中的每个基本列名。

浏览 8提问于2021-07-20得票数 0

2回答

按Spark Dataframe上的值分组

scala、apache-spark、dataframe、spark-dataframe

我正在处理一个包含这种数据的Spark数据帧： A,1,2,3 B,1,2,3 C,1,2,3 D,4,2,3 我想在最后三列汇总这些数据，因此输出将是： ABC,1,2,3 D,4,2,3 如何在scala中做到这一点？(这不是一个大的数据帧，因此性能在这里是次要的)

浏览 2提问于2018-02-26得票数 0

回答已采纳

1回答

对多个列执行dplyr group by stats，将结果表存储在一个列表中，并将该列表组合为一个数据帧

r、dplyr、tidyverse

在进行聚类分析时，有一个数据帧，其中包含一堆不同的属性列和一个用于聚类标签的列。需要对这些数据进行汇总。执行groupby sum操作，这是我想对dataframe中的多个列执行的操作，需要将生成的tibble存储在一个列表中，最后将它们放在一起作为一个dataframe。 datalist = list() for (i in 5:15){ dat = df %>% group_by(cluster) %>% summarise((colnames(df)[i]) = (sum(colnames(df)[i])))

浏览 21提问于2019-08-19得票数 0

2回答

Pandas复杂GroupBy及其在机器学习数据集上的应用

pandas、numpy、pandas-groupby、apply

我有一个用于机器学习数据集的数据集。下面列出了我的数据帧。数据帧= df memid year code1 code2 ....... n amount of columns 1 2014 8888 654 2 2016 13456 4353 2 2016 12345 3333 1 2014 123333 1111 1 2016

浏览 14提问于2019-09-24得票数 0

回答已采纳

1回答

Python Pandas:将一列合并到另一个数据框不会返回相同数量的行

python、python-3.x、pandas

我有两个数据帧:第一个数据帧(假设df1)有389行5列，第二个数据帧(假设df2)有10025行10列。我想将其中一列(假设列名为'description')合并到第一个数据框中。我使用pd.merge()命令来合并列，如下所示： pd.merge(df1,df2[['ID','description']],on='ID',how='left') 但是，上面的命令返回22338行。当我在stackoverflow上搜索时，我发现有一个线程请求将drop_duplicates与第二个数据帧一起使用。因此，我更改了

浏览 12提问于2020-06-05得票数 0

回答已采纳

1回答

R-使用dplyr中的权重数据帧汇总每一列？

r、dplyr

假设我有一个数值数据帧和第二个数值数据帧，它们是这样构建的权重： Monday <- c(1, 1, 10) Tuesday <- c(1, 2, 3) df <- data.frame(Monday, Tuesday) Monday <- c(10, 10, 1) Tuesday <- c(1, 1, 1) df_weights <- data.frame(Monday, Tuesday) 如何使用加权平均值汇总第一个数据帧的每一列，并将第二个数据帧中的相应列作为权重值的来源？此外，我希望在单个数据帧中同时使用平均值和加权平均值，如何使用这样的两个函数

浏览 0提问于2021-09-16得票数 0

1回答

R将数据帧中选定列的摘要写入新数据帧

r、dataframe

如下所示的数据， text = " a,b,c NA,20,-10 1,10,5 2,5,-30 3,30,40 4,40,NA NA,39,-24.9 " df = read.table(textConnection(text), sep=",", header = T) 我可以获得特定列的summary值，如下所示 summary(df[, c("a", "c")]) 我想要的是汇总结果生成一个新的数据帧，其中原始df中的列名作为行名，汇总属性(如Min.、Mean等)。作为列名，如下所示 +---+--------+----

浏览 3提问于2019-11-20得票数 0

2回答

在.csv中具有两个不同表的pd.read_csv问题

python、pandas

我有一个csv文件，它是在信息之上设置的信息，我正在努力将其读取到数据帧中。原始CSV如下所示： ? 我希望得到基本上3个不同的东西: 1)在第一行定义日期和公司名称2)将汇总表(顶层表)放入数据框3)将详细的sales表放入另一个数据框我尝试了df = pd.read_cs(filepath,error_bad_lines=False)，它只给出了汇总表，但是只有3行，因为第一行只有3列。对如何阅读这些文件有什么想法吗？汇总表的行号不固定(行数不同)。任何帮助都将不胜感激！谢谢!

浏览 25提问于2020-04-22得票数 0

回答已采纳

3回答

对pandas中特定列的所有单元格的数字求和，这些数字存储为字符串

python、pandas

我使用的数据帧有一个名为"NUM_EMPL“的列，它存储特定公司的员工数量。正如您在中看到的，这些单元格包含字符串。现在我已经写了一段代码，它可以汇总该列的一个特定单元格： list = buildings.loc[61, 'NUM_EMPL'].split(', ') int_list = [float(i) for i in list] print(sum(int_list)) 现在，我想对每个单元格执行此操作，并将每个单元格的总和存储在一个新的数据帧中。如何遍历单元格？

浏览 0提问于2021-11-08得票数 0

1回答

根据特定数据范围按其他列汇总数值

我有以下数据集： name<-c("John","John","John","John","John","John","John") Dealer<-c("ASD","ASD","ASD","ASD","ASD","ASD","ASD") Date<-c("2020-01-03","2020-01-04","202

浏览 14提问于2020-01-24得票数 0

回答已采纳

2回答

数据帧中的循环

r、if-statement、for-loop

这是我的数据帧的简称： ID IDaxis Y Date-Time Tdiff 1 1 5 2012-06-11 13:10:30 0.00 1 1 10 2012-06-11 15:10:30 2.00 1 1 20 2012-06-11 17:10:30 2.00 1 3 15 2012-06-11 13:20:30 0.00 1 3 30 2012-06-11 14:20:30 1.00 1 3 45 2012-06-11 17:20:30 3.00

浏览 0提问于2012-12-13得票数 0

回答已采纳

2回答

如何重新排列单独的数据帧并将它们连接到单个摘要数据帧中？

python、dataframe、merge

我有以下数据帧： result=pd.DataFrame({'BID':1.87,'ASK':1.95},index=[0]) result1=pd.DataFrame({'BID':1.95,'ASK':2.05},index=[0]) result2=pd.DataFrame({'BID':1.95,'ASK':2.065},index=[0]) result.index.name='nok' result1.index.name='sek' resul

浏览 7提问于2019-11-05得票数 0

回答已采纳

1回答

添加对此行之前的值求和的列

r、sum、dataframe

假设我有一个数据帧df，其中有一列，即time。现在，我想向dataframe accumulated添加一个新列，如下所示，它汇总了来自df.time的每一行的值。 time accumulated 1 10 10 2 12 22 3 14 36 4 6 42 一个快速的提示将是非常好的！

浏览 1提问于2012-11-03得票数 0

回答已采纳

2回答

我是否可以编写一个Excel和或sums产品，根据在引用列中识别字符串来对列中的单元格求和？

excel、string、sumproduct

我正在尝试从源表构建一个excel中的汇总表，其中汇总表的列和行是源表中的字符串：源数据如下所示：汇总表如下所示：由于可能会出现多个数据行，并以"Paris 1“作为描述，因此汇总表单元格Paris x Day1需要将所有Paris 1行相加。这方面的逻辑看起来并不太复杂，但我对Excel的字符串函数还不够好，无法解决这个问题。可能是一些涉及SUMPRODUCT，ISNUMBER和搜索的东西？如果有人能帮忙的话，我们将不胜感激。

浏览 1提问于2021-12-02得票数 0

回答已采纳

3回答

将数据帧与python中的行数一起滚动

python、pandas、dataframe、rollup

我还处在python的学习阶段，我想知道如何在一个名为 count 的列中汇总数据并计数重复的数据行。数据帧结构如下 Col1| Value A | 1 B | 1 A | 1 B | 1 C | 3 C | 3 C | 3 C | 3 我的结果如下 Col1|Value|Count A | 1 | 2 B | 1 | 2 C | 3 | 4

浏览 4提问于2016-04-01得票数 2

回答已采纳

2回答

如何在R中快速汇总多个数据帧

r、csv、dataframe、summary

提前感谢你在这方面的帮助。我尝试简单地汇总R中的多个数据帧，我有一个正在读取的文件，其输出如下所示： NDC CHARGE GENERIC 4060 68382006401 43.34 true 4061 68382006401 95.04 true 4062 68382006410 16.77 false 我将正在读取的数据文件保存到变量“.csv”中。读取数据后，根据泛型列是true还是false，我将其分为另外两个变量("true“和"false")。我想要做的是有效地总结三个不同数据帧中的一些列。目前我使用的是：

浏览 3提问于2013-02-05得票数 0

回答已采纳

1回答

来自变量的r组数据帧

r、dplyr、group-summaries

我希望设置将数据帧分组为变量的列，然后根据该列对数据框架进行分组和汇总，即 require(dplyr) var <- colnames(mtcars)[10] summaries <- mtcars %>% dplyr::group_by(var) %>% dplyr::summarise_each(funs(mean)) 这样，我就可以简单地更改var并使用第二行而无需更改任何内容。不幸的是，当group_by询问列名而不是变量时，我的解决方案不起作用。

浏览 6提问于2016-09-09得票数 0

回答已采纳

2回答

R和Stata之间的合并命令比较

r、merge、stata

作为一名R用户，我现在正在使用资源学习merge，并且对Stata命令感到困惑。在R中，我不必担心错误地合并数据，因为它无论如何都会合并所有内容。我不需要担心公共列是否包含任何重复的列，因为Y数据帧将合并到X数据帧中的每个重复行。(在merge中使用all=FALSE ) 但是对于Stata，在继续合并之前，我需要从X中删除重复的行。在Stata中，是否假设为了让merge继续，主表中的公共列必须是唯一的？

浏览 0提问于2011-09-07得票数 8

3回答