如何使用python pandas对新字段进行分组和计算？_Python Pandas，如何对字典和排序列表进行分组_如何使用python pandas对列进行分组并对条件值进行计数？ - 腾讯云开发者社区

python、pandas、dataframe、pandas-groupby

我想按数据框中名为“fruit”的特定列进行分组，并计算该特定水果中“好”的百分比。有关我的初始数据框架，请参阅下面的内容 import pandas as pd0 Apple 50

浏览 18提问于2021-10-24得票数 3

回答已采纳

1回答

如何对与Pandas创建的每个组相关的一系列数据求和？

python、pandas、pandas-groupby

在Python pandas数据框中，假设我使用pandas groupby()方法对数据进行分组，结果如下：import pandas as pd data = p

浏览 0提问于2018-08-05得票数 0

1回答

如何在python中按相同的签入日期和签出日期对日期数据进行分组/计数？

python、pandas、date、group

我试图根据相同的签入和签出日期对日期数据进行分组，例如：check_in = ['17/07/2021', 'pd.DataFrame({'guess':guess, 'check in date': check_in, 'check out date': check_out})

浏览 3提问于2022-07-17得票数 0

回答已采纳

1回答

该文件基本上具有头文件和逗号分隔值。关键字段有月、日、年、拼码、计数。 Count表示该PIN码的事故计数，但是每个PIN码可以在一天中获得多个条目，例如每隔几个小时。因此，我希望能够计算在给定日期每个PIN码的最大事故数，即我需要按月、日、年、PIN码分组，然后在分组后求和计数？如果我将大文件加载到数据库或云服务(如GCP BigQuery )中，我知道如何完成此操作，但我希望能够使用Python/Pandas dataf

浏览 22提问于2021-09-23得票数 0

1回答

要使sum抛出循环

python、loops、filter、data-science

我有一个列表中的状态列表，我想过滤得到所有国家分组由总贷款的国家和总和的贷款要求&总和的国家，我正在使用下面的代码，请指导我在哪里我错了，我可以做得更好。

浏览 22提问于2019-08-25得票数 0

1回答

PySpark:带有标量Pandas的无效returnType

apache-spark、pyspark、apache-arrow

from pyspark.sql.functions import pandas_udfimport numpy as np 116 except TypeError: 65 C:\opt\spark\spark-2.3.0-bin-

浏览 2提问于2018-03-26得票数 5

回答已采纳

1回答

熊猫一片片串在一起

python、pandas、dataframe

我有一个dataframe，我想按ID字段的第一部分进行分组。例如，假设我有以下内容：>>> df=pd.DataFrame(data=[['AA',1],['AB',4],['AC',5],['BA',11],[df0 AA 12 AC 54 BB

浏览 1提问于2015-12-30得票数 6

回答已采纳

1回答

Apache读取csv文件和groupbykey

python、json、group-by、apache-beam、apache-beam-io

我有一个csv文件，我知道如何使用pandas实现这一点，基本上将csv作为一个df ->组按字段‘aaa’、‘bbb’读取数据，然后构造一个新的'id‘。我的问题是如何在Apache Beam中实现相同的功能，我以前从未使用过它，我试图使用Beam读取这个csv文件和分组多个记录，但是我对熊猫使用的相同功能不支持Beam，下面是我的当前代码：我的

浏览 2提问于2021-08-16得票数 0

回答已采纳

1回答

如何在Python Pandas中进行嵌套循环类型的操作？

python、pandas、dataframe、loops、subset

我需要找到一个子集的子集，并且需要迭代地进行，然后在这个子集的每个实例上计算一个值，然后将其保存到一个新的输出表中。为了更好地解释，我有一个类似于下图所示的数据框；我需要迭代数据集，并对团队A(组2)的所有人员1(组1)的成本求和。然后移动到人员2，并对所有团队再次执行相同的操作。示例如下： ? , Team, Newcost) 然而，我是Python和pandas的新手，我发现很难使用相同的方法，因为我有一个数据帧设置<e

浏览 18提问于2020-08-24得票数 0

1回答

组与公式和列的可变数

python、formula、pandas-groupby

我需要创建一个具有可变列数的分组数据框架，其中已经计算了字段。问题是如何使它假设我将有多个列组和多个分组条件。

浏览 1提问于2019-07-25得票数 0

回答已采纳

1回答

计算并广播pandas中的计数(使用groupby转换)

python、pandas、aggregation、split-apply-combine

我如何计算和广播一个熊猫的计数？要计算计数，请执行以下操作： df.groupby('field').size() 要向原始数据帧广播聚合，请执行以下操作： df.groupby('field')['field_to_aggregate'].transform(aggregation) 如果我指定要聚合到的字段和聚合(如sum、mean等)，则后者可以工作。但是，当我想要简单计数分组字段时，我

浏览 34提问于2020-11-25得票数 1

1回答

在Python中使用pandas基于条件进行计数

python、pandas

我使用的是pandas，我想要计算符合特定条件的行数，但我想要在不同的级别进行计数。CD 03 Advanced PD 02 Advanced values.append(sum(g['Method'] ==

浏览 33提问于2019-03-20得票数 0

回答已采纳

2回答

熊猫pivot_table不分组

python、pandas、pivot-table

在不提供分组的情况下，使用pandas.pivot_table计算整个表上的聚合函数的最佳方法是什么？例如，如果我想将A、B、C的和计算成一个有一行的表，而不按任何列进行分组：>>>(keys) File "/to

浏览 10提问于2015-07-01得票数 2

回答已采纳

2回答

按数据分组的Pandas之和(Python)

python、pandas、dataframe

对于我的任务，我需要理解一些Python代码，以便进行一些修改，并使用另一种编程语言(Java)重新实现它。我参加了一些在线教程，但仍然对Pandas有问题。uniq_page_df.sum().reset_index()在这一部分中，据我所知，作者试图计算出总视图数所以我的问题是，为什么我们需要对每个组(第2行)进行分组</e

浏览 1提问于2018-03-01得票数 0

回答已采纳

3回答

Pandas: df.groupby()对于大数据集来说太慢了。有什么替代方法吗？

python、pandas、grouping、bigdata

我有一个有380万行和一列的pandas.DataFrame，我尝试按索引对它们进行分组。df = df.groupby(df.index).sum()<class 'pandas.core.frame.DataFrame'> Index: 3

浏览 1提问于2017-06-23得票数 15

2回答

群熊猫数据与计算多列均值

python、pandas、dataframe、pandas-groupby

我试图将熊猫的数据按列分组，然后计算出多个列的平均值。在下面的示例中，我想按“类别”列进行分组，然后计算“得分”和“优先级”列的平均值。所有三列都应位于生成的dataframe中。我能够对第一列进行分组并计算平均值，但我不知道如何添加第二列。在我的尝试之下。 data = [['A', 2, 1],

浏览 3提问于2022-05-24得票数 1

回答已采纳

3回答

如何将所有列保存在一个dataframe中，加上添加groupby和sum？

python、python-3.x、pandas

我有一个有5个字段的数据框架。我想将两个字段从这个复制到一个新的数据框架中。这个很好用。df1 = df[['task_id','duration']] See the caveats in the documentation: h

浏览 0提问于2018-12-05得票数 0

回答已采纳

1回答

JuliaDB或DataFrame比平面数组快吗？

julia

我想知道普通数组与JuliaDB或DataFrame在对大型数据集(大型但仍然适合内存)上的计算性能是否存在差异？我可以使用简单的数组和算法来进行排序、分组、缩减等等，那么为什么我需要JuliaDB或DataFrame呢？我有点理解Python为什么需要Pandas --因为它将缓慢的python转化为快速C，但是为什么Julia需要JuliaDB或DataFrame -- Julia已经快了。

浏览 0提问于2018-03-26得票数 10

回答已采纳

1回答

熊猫，数据，群，性病

python、pandas、statistics

我想按主机分组，然后按host+operation分组，计算每个主机执行时间的std偏差，然后根据host+operation对计算std偏差。看起来很简单？它适用于按单个列进行分组：Out[360]:Int64Index: 132564 entries, 0 to 132563_wrap_agged_blocks(new_blocks

浏览 0提问于2013-12-03得票数 7

回答已采纳

1回答

熊猫条件切片，同时使用“和”和“或”

python、pandas

我在谷歌或这里找不到答案(对谷歌来说很难)。我试图选择符合某些条件的数据。这是我代码中的一个片段。

浏览 5提问于2020-10-02得票数 2

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云