Pandas groupby sum，在结果数据框中保留特定列_Pandas将数据框列与groupby结果相乘_在pandas数据框中使用groupby计算cum sum - 腾讯云开发者社区

python、pandas、pandas-groupby

在Python pandas数据框中，假设我使用pandas groupby()方法对数据进行分组，结果如下：我如何从Third列中分别计算每个组(这里是A和B)的值的总和，这样我就可以在一个单元格中获得每个主要组的总和值？例如，我可以将12+32+43放在组A的新单元格中，将145+231+123放在组B的另一个单元格中。我的代码是： import pandas as pd data = pd.read_excel('file.xlsx') mydf = data.groupby[['First','Second']].sum()

浏览 0提问于2018-08-05得票数 0

4回答

我如何使用pandas agg对布尔值进行求和，并始终得到结果？

python、pandas、pandas-groupby

我有一个包含bool类型列的数据框。我想使用pandas的groupby和agg函数来获取每个id的True值的数量。我已经做过很多次了，但是结果列的类型似乎取决于数据框。下面是一个示例： import pandas as pd d = {'id': [1, 1, 2, 3], 'bool': [True, False, False, True]} df = pd.DataFrame(data=d) print(df.groupby(['id']).agg({'bool': 'sum'})) 我从这段代码

浏览 0提问于2020-04-03得票数 1

2回答

在pandas数据框中保留带有sum的groupby中的列名

python、pandas、group-by、sum

我必须在pandas数据框中执行groupby ()，结果必须是具有相同列(相同名称和相同编号)的数据框。示例： import pandas as pd raw_data = {'first_name': ['Jason', 'Molly', 'Jason', 'Jake', 'Molly'], 'last_name': ['Miller', 'Jacobson', 'Miller', 'Milner', &

浏览 1提问于2019-02-08得票数 0

1回答

如何从Python Pandas中的几个数据点重新计算单元格的百分比？

python、pandas

我已经在Stackexchange上浏览了不同的问题，但还没有想好如何在Pandas中做我需要的事情。我认为这最终会非常简单！我正在做一个任务，其中一个数据集有一堆产品，每个产品在它所在的每个商店都有一行。因此，产品A将有单独的食品，药店，目标，沃尔玛等线。然后，它的可用性和该网点的重要性成倍增加，我需要将结果重新百分比等于100%。现在我在Excel/Google工作表中手动操作，但这很烦人和乏味。我可以告诉如何使用Groupby获得每个产品E列的总和，但我不知道如何显示每个产品的数字，以便E列中的每个数字可以划分为E列。有人有什么建议吗？

浏览 0提问于2018-04-19得票数 0

1回答

如何在pandas中选择列的特定实例？

python、pandas、dataframe

我正在努力改进我的客户报告的筹款表现，我加入了特定的参考代码，以便能够跟踪电子邮件的表现。我已经成功地加载到我的数据框中，但是我不知道如何选择列的特定实例。例如，我正在尝试绘制3个参考代码(SAN_20210811_GEN_FDR_X、SAN_20210808_GEN_ENG_X和SAN_20210803_GEN_FDR_X)的性能图。我在我的数据框中加载： import pandas as pd data = pd.read_excel(r'C:\Users\Sandro\Downloads\SANdata.xlsx') df = pd.DataFrame(data, c

浏览 8提问于2021-08-11得票数 0

回答已采纳

1回答

更改DataType的GroupBy方法

pandas、pandas-groupby

使用Python3和Anaconda，我在ipython上导入了pandas和os。我有一个非常大的csv文件。在对文件使用read_csv之后，我尝试对两列使用.groupby()，但它将数据类型从DataFrame更改为DataFrameGroupBy，并且我不能再对其运行数据框方法。我想不出任何可以尝试的东西。我对熊猫的经验很少，通过codecademy获得的。我的代码似乎可以在那里工作。 import os import pandas as pd totals = pd.read_csv('filename') band_gaps = totals.groupb

浏览 19提问于2019-06-21得票数 0

回答已采纳

1回答

Python Pandas-根据给定的窗口并从特定值开始计算特定列的总和

python、pandas

我正在尝试在Python Pandas数据框中创建一个新列，其中包含指定范围内另一列的相加值，并从某一行开始。例如，在下面的数据框中，我希望跟踪1的值列的总和从第3行开始(使用索引行号)。但是，我还需要对跟踪2重复相同的标准。此外，我需要从每个跟踪的相同样本号开始。有什么想法吗？

浏览 7提问于2018-07-29得票数 0

回答已采纳

6回答

在Pandas数据帧中创建value_counts的列

python、pandas

我想从我的一个Pandas数据框列中创建一个唯一值的计数，然后将具有这些计数的新列添加到我的原始数据框中。我试过几种不同的方法。我创建了一个pandas序列，然后使用value_counts方法计算计数。我尝试将这些值合并回我的原始数据帧，但我希望合并的键在Index(ix/loc)中。 Color Value Red 100 Red 150 Blue 50 我想返回如下内容： Color Value Counts Red 100 2 Red 150 2 Blue 50 1

浏览 0提问于2013-07-18得票数 71

2回答

在空的dataframe中保留组后的列

python、pandas、dataframe、group-by、pandas-groupby

dataframe是query.when groupby之后的一个空df，引发运行时警告，然后获得另一个没有columns.How的空数据raise来保留列？ df = pd.DataFrame(columns=["PlatformCategory","Platform","ResClassName","Amount"]) print df 结果： Empty DataFrame Columns: [PlatformCategory, Platform, ResClassName, Amount] Index: [] 然后分组讨论

浏览 5提问于2017-09-07得票数 9

回答已采纳

1回答

聚合空DataFrame时保留列

python、pandas、group-by

我在python 2.7.9的pandas 0.18.0中工作。获取一个示例DataFrame并按几列分组，然后对不同的列求和以得到结果，如下所示： >>> df = pandas.DataFrame([[1,2,3],[4,5,6],[1,2,9]], columns=['a','b','c']) >>> print df a b c 0 1 2 3 1 4 5 6 2 1 2 9 >>> df.groupby(['a','b']

浏览 10提问于2016-07-29得票数 4

1回答

如何使用groupby子句中包含的列创建数据帧？

python、python-3.x、pandas、pandas-groupby

我有个数据框。它有3列A，Amount。我用'A‘做了一个群。现在我想把这些值插入到一个新的数据框中，我该如何实现呢？ top_plt=pd.DataFrame(top_plt.groupby('A')['Amount'].sum()) 生成的dataframe仅包含Amount列，但缺少groupby 'A‘列。示例：结果：

浏览 0提问于2020-01-12得票数 1

1回答

熊猫:如何基于多列组合行

python、pandas、dataframe

假设我有这样的数据 import pandas as pd test = [ {1: 434, 2: 343, 3: [592]}, {1: 434, 2: 343, 3: [192]}, {1: 534, 2: 743, 3: [392]}, ] df = pd.DataFrame(test) df 1 2 3 0 434 343 [592] 1 434 343 [192] 2 534 743 [392] 我希望合并列2和3相同的行，并将第3列中的列表相加。期望结果 1 2 3 0 434 343 [592, 192] 2

浏览 5提问于2022-10-15得票数 0

回答已采纳

6回答

按累计和分组的熊猫

python、pandas、pandas-groupby

我想在我的Pandas数据框中添加一个累积和列，以便： name | day | no -----|-----------|---- Jack | Monday | 10 Jack | Tuesday | 20 Jack | Tuesday | 10 Jack | Wednesday | 50 Jill | Monday | 40 Jill | Wednesday | 110 变成： Jack | Monday | 10 | 10 Jack | Tuesday | 30 | 40 Jack | Wednesday | 50 | 90 Jil

浏览 1提问于2014-03-26得票数 119

2回答

为分组的pandas数据帧创建散点图

python、pandas、dataframe、matplotlib、scatter-plot

我有一个Pandas DataFrame，我想要按某个列进行分组。然后，我想对这个分组的数据帧做一个散点图。然而，如果我这样做了，我会得到一个错误，因为我分组的列是无法识别的。 # Data loading, processing and for more import pandas as pd import numpy as np # Visualization import seaborn as sns import matplotlib.pyplot as plt # set seaborn style because it prettier sns.set() df = pd.D

浏览 27提问于2020-12-17得票数 0

回答已采纳

3回答

Pandas groupby and sum

python、pandas

我有一个由三列A、B、C组成的pandas数据框，我需要根据行值对值进行求和以下是场景 A B C Distance_a distance_b 5 Distance_a distance_c 6 distance_b distance_c 7 distance_b distance_d 7 distance_d Distance_a 9 如果我想要找出到distance_A的累积距离，我需要我的代码加上5,6，而且它还应该考虑最后一列，即distance_d dis

浏览 38提问于2019-11-14得票数 0

3回答

如何将所有列保存在一个dataframe中，加上添加groupby和sum？

python、python-3.x、pandas

我有一个有5个字段的数据框架。我想将两个字段从这个复制到一个新的数据框架中。这个很好用。df1 = df[['task_id','duration']] 现在在这个df1中，当我尝试按task_id和sum duration分组时，task_id字段就会下降。以前(我现在有的)。在(我正在努力实现的)之后。所以，例如，我正在尝试这样做： df1['total'] = df1.groupby(['task_id'])['duration'].sum() 结果是： A value is tryin

浏览 0提问于2018-12-05得票数 0

回答已采纳

2回答

添加两个pandas dataframe列，它们只是后缀参数不同，例如"A_x"，"A_y“，并将这两个列重命名为"A”

python、pandas

如何添加两个仅有后缀参数不同的pandas数据框列，例如"A_x"，"A_y“，并将这两列重命名为"A”。例如，我有一个像这样的数据列的重命名必须不带任何后缀，如CT_1或CT_2等。

浏览 13提问于2019-11-05得票数 0

回答已采纳

2回答

如何使用Pandas对两列进行分组并计算行的总和？

python、pandas、pandas-groupby

我有一个熊猫数据框df，如下所示： Name Hour Activity A 4 TT A 3 TT A 5 UU B 1 TT C 1 TT D 1 TT D 2 TT D 3 UU D 4 UU 下一步是，如果行的Name和Activity列具有相同的值，则获取总和。例如，对于这种情况，Name: A和Activity: TT将给出7的总和结果如下所示 TT UU A 7 5 B 1 0 C 1 0 D

浏览 17提问于2020-10-09得票数 2

回答已采纳

1回答

如何使用Pandas保留我的group by中使用的列名

python、pandas、pandas-groupby

我有两个数据帧。我想在第二个数据框上使用group by，然后在Company Name列中将这两个数据框合并在一起。问题是，使用group by语句时，我丢失了Company Name列。 import pandas as pd df1 = pd.DataFrame( { 'Company Name': ['Google','Google','Microsoft','Microsoft','Amazon','Amazon'], '

浏览 17提问于2019-05-31得票数 0

回答已采纳

1回答

如何对Pandas + applicate中的特定列进行分组？

python、pandas、aggregate-functions

我有一个包含不同列的数据文件： “排名”、“文件”、“可引用文件”、“引文”、“自我引用”、“每个文件的引用”、“H索引”、“能源供应”、“Capita能源供应”、“可再生百分比”、. 现在，首先，我必须添加两列“大陆”以及"PopEst“(估计人口)。现在，我被要求创建一个新的数据框架，其中大陆作为索引，列为“size”、“sum”、“均”、“std”。我知道有一个完全简单的解决方案..。;-( 在大量在线阅读之后，我尝试了几件事，但似乎找到了一个解决方案:我的想法是用这个创建一个新的Pandas Dataframe。 Continents=Top15.groupby('

浏览 1提问于2017-11-02得票数 1

回答已采纳

2回答

将DataFrame分组到以arange为索引的新DataFrame中

python、pandas、pandas-groupby

我有一个问题，在这个例子中简化了。考虑这个Pandas DataFrame，df_a： df_a=pd.DataFrame([['1001',34.3,'red'],['1001',900.04,'red'],['1001',776,'red'],['1003',18.95,'green'],['1004',321.2,'blue']],columns=['id','amount','name&#

浏览 2提问于2017-12-20得票数 8

回答已采纳

3回答

按行对值求和

python、pandas、numpy、glob

我有三列数据，如下所示：输入文件： >>>>> 1.0 2.0 3.0 2.0 2.0 4.0 3.0 4.5 8.0 >>>>> 1.0 2.5 6.8 2.0 3.5 6.8 3.0 1.2 1.9 >>>>> 1.0 1.2 1.3 2.0 2.7 1.8 3.0 4.5 8.5 在上面的输入文件中，第一个列值是重复的，所以我只想获取该值一次，并希望逐行对第三个列值求和，而不希望获取任何第二个列值。我还想用固定值1.0追加第三列最后，我想将结果保存在另一个名为output.txt的测试文件中

浏览 27提问于2021-09-08得票数 0

回答已采纳

1回答

日期相同的汇总列(和)

python、excel、pandas、xlsx、xlsxwriter

因此，我需要聚合日期相同的行。从现在开始，我的代码返回以下内容： date value source 0 2018-04-08 15:52:26.110 1 ANAPRO 1 2018-04-22 12:14:38.807 1 ANAPRO 2 2018-04-22 12:34:18.403 1 ANAPRO 3 2018-04-22 12:40:35.877 1 ANAPRO 4 2018-04-22 12:53:57.897 1 ANAPRO 5 2018-04-22

浏览 0提问于2018-05-16得票数 2

回答已采纳

3回答

如何基于分组列计算熊猫的DF值

python、pandas、dataframe

我对Pandas的数据比较陌生，我必须做简单的计算，但到目前为止，我还没有找到一个很好的方法去做。基本上我拥有的是： type group amount 1 A real 55 2 A fake 12 3 B real 610 4 B fake 23 5 B real 45 现在，我必须添加一个新的列，它将显示伪造产品在类型总数中所占的百分比。因此，这个表的简单公式是A 12 / (55 + 12)

浏览 1提问于2016-12-07得票数 1

回答已采纳

2回答

如何按月份和另一列pandas数据框分组

pandas、dataframe、datetime

我有一个数据框，如下所示： import pandas as pd df = pd.DataFrame({'Date':[2019-08-06,2019-08-08,2019-08-01,2019-10-12], 'Name':['A','A','B','C'], 'grade':[100,90,69,80]}) 我想按Datetime中的月份和年份对数据进行分组，也可以按名称进行分组。然后对其他列进行汇总。因此，期望的输出将类似于下面的内容 df = pd.DataFrame

浏览 12提问于2020-08-19得票数 0

2回答

尝试理解pandas中的groupby()和sum()

pandas

我对groupby()的理解是，所选的列充当对其余列进行分组的索引。所以如果我有 import pandas as pd df = pd.DataFrame([[0, 1, 3],[3, 1, 1],[3, 0, 0],[2, 3, 3],[2, 1, 0]], columns=list('xyz')) gby = df.groupby('x') df: x y z 0 0 1 3 1 3 1 1 2 3 0 0 3 2 3 3 4 2 1 0 我的groupby结果的概念模型是 y z x 0 1 3 2

浏览 0提问于2019-12-31得票数 1

1回答

使用Pandas对与主键和辅键相关的所有值求和

python、excel、pandas、dataframe、series

我有一个由三列(id、买卖、金额)组成的数据框架。我想把每个唯一id对应的买卖金额加起来。我希望输出是一个新的数据框或pandas系列，如下所示： id buy/sell amount blue buy 9 sell 5 green buy 0 sell 8 red buy 3 sell 12

浏览 20提问于2019-10-22得票数 0

1回答

熊猫群在一列名单上

python、python-3.x、pandas、pandas-groupby

我有一个包含pandas的列的lists数据 df = pd.DataFrame({'List': [['once', 'upon'], ['once', 'upon'], ['a', 'time'], ['there', 'was'], ['a', 'time']], 'Count': [2, 3, 4, 1, 2]}) Count List 2 [once, upon] 3 [onc

浏览 3提问于2018-03-22得票数 7

回答已采纳

2回答

如何使用聚合方法从熊猫系列中获得独特的值？

python、python-3.x、pandas

考虑一下这个dataframe df = pandas.DataFrame(numpy.random.randint(0,100,size=(200, 4)), columns=list('ABCD')) df['E'] = list(numpy.arange(1001, 1021)) * 10 df['F'] = ['c', 'b', 'b', 'a', 'd'] * 20 + ['d', 'a', 'b', '

浏览 2提问于2017-06-30得票数 3

回答已采纳

1回答

Pandas:迭代已排序的列的唯一值

python、group-by、pandas

我已经按排序顺序构建了一个pandas数据框架，并希望遍历具有特定列的相同值的组。在我看来，groupby功能对此很有用，但据我所知，执行groupby并不能保证键的顺序。如何按排序顺序提取unqiue列值。下面是一个数据框示例： Foo,1 Foo,2 Bar,2 Bar,1 我想要一个列表"Foo"，“酒吧”，其中的顺序是由原始数据帧的顺序保证。然后，我可以使用这个列表来提取适当的行。在我的例子中，排序实际上是由数据框中也给出的列定义的(不包括在上面的示例中)，因此如果不能直接提取信息，则可以接受重新排序的解决方案。

浏览 2提问于2013-12-19得票数 5

2回答

存储在新数据帧中的Pandas groupby

python、pandas

我有以下代码： import pandas as pd df1 = pd.DataFrame({'Counterparty':['Bank','Bank','GSE','PSE'], 'Sub Cat':['Tier1','Small','Small', 'Small'], 'Location':['US','US','UK'

浏览 0提问于2017-08-11得票数 2

回答已采纳

3回答

Python Pandas:如何将两个列分组为一个公共列

python、pandas、dataframe

我已经从几个CSV文件创建了一个pandas数据帧。现在有一些列表示相同的内容。在这个数据框中，我想将这些列分组到一个公共列中。 Now: 0 X Y 1 6 2 7 3 1 4 5 我想要： 0 X 1 6 2 7 3 1 4 5 谢谢。

浏览 1提问于2018-11-06得票数 3

2回答

根据列的值将Pandas数据value拆分为多个数据格式

python、pandas、dataframe

如何根据列中的值将Pandas拆分为多个数据流？ df = pd.DataFrame({'A':[4,5,0,0,5,0,0,4], 'B':[7,8,0,0,4,0,0,0], 'C':[1,3,0,0,7,0,0,0]}, columns = ['A','B','C']) df["sum"] = df.sum(axis=1) df["Rolling_sum"] = df["sum

浏览 1提问于2021-11-19得票数 2

回答已采纳

1回答

如何实现熊猫群对象的聚合功能？

pandas、signature

下面是这个问题的设置： import numpy as np import pandas as pd import collections as co data = [['a', 1], ['a', 2], ['a', 3], ['a', 4], ['b', 5], ['b', 6], ['b', 7]] varnames = tuple('PQ') df =

浏览 0提问于2014-09-04得票数 2

2回答

groupby，sum和count到一个表中

python、pandas、numpy

我有一个下面的数据框 df=pd.DataFrame({"A":np.random.randint(1,10,9),"B":np.random.randint(1,10,9),"C":list('abbcacded')}) A B C 0 9 6 a 1 2 2 b 2 1 9 b 3 8 2 c 4 7 6 a 5 3 5 c 6 1 3 d 7 9 9 e 8 3 4 d 我想得到下面的分组结果(带有key="C“列)，并且有意丢弃了行c、d和e。

浏览 12提问于2016-09-02得票数 2

回答已采纳

1回答

熊猫合并中的集合映射值

python、pandas、join、aggregate、pandas-groupby

我有一只熊猫的数据 import pandas as pd df = pd.DataFrame({"a": [["x","y"]], "b": [2]}) df2= pd.DataFrame({"a": ["x","y"], "b":[2,2], "c": [3,4]}) 其中df.a有列表条目： a b 0 ["x","y"] 2 df2将这些列表元素(以及其他列的条目)映射到

浏览 0提问于2019-11-23得票数 1

回答已采纳

1回答

使用和.sum()获取%

python、pandas、dataframe、pandas-groupby

我想要一些基于.groupby() in pandas的%的费率。我的目标是取一个指标列Ind，得到A(分子)除以当年的总数(A+B)的比率。示例数据： import pandas as pd import numpy as np df: pd.DataFrame = pd.DataFrame([['2011','A',1,2,3], ['2011','B',4,5,6],['2012','A',15,20,4],['2012','B',17,12,12]], co

浏览 3提问于2021-01-08得票数 5

回答已采纳

2回答

如何使用python/pandas在行和列中查找/过滤/组合公共前缀？

python、excel、pandas

我刚开始编码，很难表达/搜索正确的术语来帮助我完成这项任务。在我的工作中，我从野外监测鸟类的人那里得到了一些相当大的excel文件。结果需要为数据库、报告、表格等准备好。我希望使用Python自动执行一些任务。如何使用Python (pandas?)基于通用名称/ID但具有唯一后缀的特定行/列，并在该通用名称下聚合/求和属于一起的结果？作为提供的表中的一个示例，我需要获得来自子位置的所有结果，例如AA3_f，AA3_lf和AA3_s，表示为主要位置AA3的新行中的子位置的总和(每个物种的海鸟总数)。有没有人可以为这个任务提供一些代码，或者以其他方式帮助我？我搜索和观看了很多关于p

浏览 0提问于2021-06-09得票数 0

2回答

重复属性的Pandas和

python、csv、pandas

我正在使用Pandas操作一个包含多个行和列的csv文件，如下所示 Fullname Amount Date Zip State ..... John Joe 1 1/10/1900 55555 Confusion Betty White 5 . . Alaska Bruce Wayne 10 . . Frustration John Joe 20 .

浏览 0提问于2015-04-12得票数 24

回答已采纳

1回答

Groupby pandas数据帧-基于来自另一个df的值

python、pandas、pandas-groupby

我有一个数据框，我在其中保存了所有相关的属性，另一个数据框中有一些属性，我想根据这些属性对第一个df进行分组。我知道如果你把一个序列(一列)作为参数，你可以按数据框分组，如果你把一个数据框作为参数，你就会得到一个错误。 ValueError: Grouper for '<class 'pandas.core.frame.DataFrame'>' not 1-dimensional 我知道我可以将列连接到原始数据框，但我不希望这样做，除非没有其他解决方案。 df.groupby([sorted_team_names]).ngroup() 这是我的代

浏览 13提问于2021-11-05得票数 1

回答已采纳

1回答

如何获取" value“列的平均值，该列根据另一列的值拆分成组

python、pandas

我想以一个简单的数据帧为例，根据另一列("name“列)中的值，将一列(" value”列)求和成组。在那之后，我想得到"value“列的平均值 In [1]: import pandas In [2]: df = pandas.DataFrame(data = [{'name': 'a', 'val': 1}, {'name': 'b', 'val': 2}, {'name': 'b', 'val': 4}]) In [3

浏览 5提问于2021-03-03得票数 0

回答已采纳

2回答

以数据帧的形式返回聚合值

python、pandas

我有一个按两列分组的pandas DataFrame和一个自定义函数，该函数从每个分组的行集计算值的元组。我正在尝试收集数据帧中的结果，并使用原始的组索引进行索引。当我使用apply()时，我得到了一个带有正确索引的Series，但是值是以元组的形式出现的。我应该如何编写我的函数，以使结果成为数据帧，并按每个组的标签进行索引？这是一个基于本教程中的数据帧的示例。 df = pd.DataFrame({'A' : ['foo', 'bar', 'foo', 'bar',

浏览 1提问于2017-02-27得票数 0

回答已采纳

1回答

熊猫DataFrame。中的聚合列依赖于另一列中的值

python、pandas、dataframe、pandas-groupby、aggregate

有一个列为driver_uuid, payment_type, order_price, bonus_payment的“orders”数据框。payment_type列有像'cash'，'card‘这样的值。order_price是一个整数。奖金也是一个整数。 ? 我需要按driver_uuid对订单进行分组，然后为每个付款类型计算order_price和，并将这些和添加到单独的列中。因此，我需要包含如下列的结果df： [driver_uuid, cash_order_price_sum, card_order_price_sum, bonus_payment_s

浏览 21提问于2021-01-07得票数 1

回答已采纳

1回答

Groupby和聚合包含列表的数据框行

python-3.x、pandas、pandas-groupby

我正在尝试将熊猫数据框中的相似列表合并到一行中。我有以下代码： import pandas as pd df = pd.DataFrame( {'A' : [1,1,2,2], 'B' : [["a","b"],["c","d"],["e","f"], ["g","h"]]}) df2 = df.groupby(['A'], as_index=False).agg(list) print(df2) 这将产生以下输出：

浏览 15提问于2019-08-07得票数 1

回答已采纳

1回答

大熊猫群体数量和群体总数的比例

python、sql、pandas

我正在尝试用熊猫做以下事情。逐个州计数，然后将该数字表示为小计的百分比。我的数据框中有原始数据。我可以获得计数，但是如何为百分比追加另一列？ state_grp = df.groupby(by=['date', 'state','ad_type']) state_grp.ad_type.agg(['count']) 我已经写了一些sql，可以做同样的事情，但是在pandas中怎么做呢？ with cte1 as ( select distinct date, state, ad_type, count(ad_ty

浏览 5提问于2018-12-11得票数 0

5回答

在原始DataFrame中作为新列的广播群结果

python、pandas、dataframe、group-by、pandas-groupby

我试图在Pandas dataframe中创建一个新列，该列基于分组数据based中的两列。具体来说，我试图复制这个R代码的输出： library(data.table) df = data.table(a = 1:6, b = 7:12, c = c('q', 'q', 'q', 'q', 'w', 'w') ) df[, ab_weighted := sum(a)/sum(b), by = "c"]

浏览 1提问于2018-12-12得票数 5

回答已采纳

1回答

在Python中聚合组并从某个计数中吐出百分比

python-2.7、numpy、pandas、aggregate-functions

我试图找出如何通过在新列上创建百分比和求和来聚合Pandas数据框架中的组。例如，在下面的数据框架中，我有A、B、C和D列，我想按A中的组进行聚合，而C应该是(频率'1‘除以不缺失值的频率)的一个百分比，而D应该是不缺失值的总和。例如，对于“foo”组，生成的数据框架应该是 A B C D foo 1.333 4 我可以在这里和那里做一些单独的部分，但不确定如何编译成一个连贯的脚本： import pandas from pandas import DataFrame import numpy as np df = DataFrame

浏览 1提问于2015-09-14得票数 4

回答已采纳

2回答

DataFrame 'groupby‘正在使用索引修复组列

python、pandas、dataframe

我使用了一个简单的'groupby‘来压缩Pandas数据帧中的行： df = df.groupby(['col1', 'col2', 'col3']).sum() 在新的DataFrame 'df‘中，'groupby’函数中使用的三列现在在索引中是固定的，并且不再是列索引0、1和2-以前的列索引4现在是列索引0。如何阻止这种情况发生/将三个“groupby”列与原始数据一起重新包含？

浏览 12提问于2021-04-28得票数 2

回答已采纳

1回答

如何在一个混合了字符串和字符串列表的特定列中分隔包含列表的单元格？

python、pandas、dataframe、rows

我正在尝试用python组织一个pandas数据框，它具有以下伪结构(为了便于理解，我更改了变量名)： Initial_df 什么代码能够拆分col_1中的列表，使得该列只剩下单独的字符串，并且COL2中存在的这些单独字符串的计数根据从包含列表的行中获得的值进行调整。即，对于上面的行1，将行2和行6的a的值与当前3相加，以得到3+6+3的'a | 12‘。最终的数据框应如下所示： output_df 在这个数据框中有189行，所以我不能使用一个代码来期望我在组织数据时识别数据的"a"，"b“，甚至"a，b”。col_1既可以是字符串，也可以是已经标识

浏览 11提问于2020-10-11得票数 0

回答已采纳

3回答

我如何在pandas中分组，然后求和值？

python、pandas、dataframe、group-by、sum

我有下一个问题:我在pandas中有一个dataframe，它有一个属性‘feature’和另一个属性'VOTES‘。“‘VOTES”是数字，“features”是在数据帧中重复的字符串。我想要根据特征分组，并将投票的值相加，以获得下一个结果： Dataframe最初： +----------+---------+ | features | VOTES | +----------+---------+ | A | 4 | +----------+---------+ | V | 3 | +----------+---------+

浏览 0提问于2018-10-10得票数 0