按数据帧分组然后过滤pandas的最有效方法

文章/答案/技术大牛

发布

1回答

、、

下午所有人，display(df_ccy [df_ccy ['state']=='Done'][['currency_str','state','count']]) 我是否应该像上面那样在原始的groupby语句或过滤器上使用Lambda函数？

浏览 16提问于2018-03-01得票数 1

回答已采纳

4回答

在pandas中，我想要做的是：df.groupby('A').filter(lambda x: x.name > 0) - group by列A，然后过滤名称为non positive的组。但是，当GroupBy.filter返回DataFrame时，这会取消分组，从而丢失分组。我想按这个顺序来做，因为它应该对计算要求较低，因为filter后面跟着groupby会遍历DataFrame两次，不是吗(首先过滤

浏览 3提问于2018-04-14得票数 12

1回答

pandas奇特的索引和合并

、

在通过花哨的索引过滤后，将更改合并回pandas数据帧的最简单方法是什么？d[d.x % 2 == 0]['y'

浏览 0提问于2013-01-13得票数 4

1回答

如何删除由python代码创建的所有pandas dataframe

、、

我想删除我的python代码创建的所有pandas dataframe。我知道有一个选择 del df 要删除dataFrame df，请执行以下操作。但是我看起来有点像R命令 rm(list=ls()) 删除由我的代码创建的所有可用数据帧。你能建议一下吗？

浏览 32提问于2020-09-07得票数 0

回答已采纳

1回答

按2列分组并取其他两列的点积后，将一列添加到原始熊猫数据框架中。

、、、

我有以下的熊猫数据框架：我想在原始数据帧中添加Avg price列，然后按(Date，Issuer)分组，然后取权重和价格的点积，这样就可以这样：是否有一种不使用合并或联接的方法来完成此操作做这件事最简单的方法是什么？

浏览 4提问于2020-02-06得票数 0

回答已采纳

1回答

计算Pandas Dataframe中多列的日平均值，然后插入一行

、、、、

我使用Pandas向数据帧输入了一个CSV文件，并希望计算其中列的日平均值。有两个列不会被平均化，时间和日期(日期是数据分组的日期)。然后，我希望在该日期的最后一行下面插入一行，在date列中插入“Average”( time列中没有任何内容)，然后在正确的列中插入相应的平均值。我只使用了Pandas一段时间，所以我不知道最简单的</em

浏览 12提问于2022-06-17得票数 0

2回答

如何在python中获取基于两个类别的列的最后一个值？

、、、

我有一个数据集，其中包含date、shift、value等列。我想从值列中提取每个date和shift的最后一个值。例如，对于每一天，有两行，一行包含每个班次的日期时间、班次(白天或晚上)和最后一个数据点from value。在本例中，我想提取第3行(因为7/14和Day time的最高值为3) ? 我只知道如何获得每一列的最大值。我尝试了几种方法来完成这项工作，但对我来说都不起作用。我是python的新手，正在寻求您的</e

浏览 15提问于2020-07-27得票数 0

回答已采纳

1回答

如果重复，则在Python Pandas中返回相应的行值

、、、

我正在尝试对excel的一列进行排序，以显示重复的邮政编码。如果存在重复的邮政编码，我会尝试让pandas从重复的邮政编码中查找一列，对这些值求和，然后使用重复/求和的值创建一个新的列表。目前，我可以创建所有副本的列表，但我不知道下一步需要采取什么步骤。感谢任何帮助，因为我是编码新手。

浏览 27提问于2019-11-09得票数 0

回答已采纳

1回答

对多个列表元素应用一组指令

我有一些代码可以从目录中读取所有的xlsx，将其作为列表导入到RStudio中，并用文件名命名列表中的每个元素。每个元素都存储为一个数据帧。我刚接触R，但是在列表的每个元素上应用一组函数最合理的方法是什么呢？每个数据帧在布局上都是相同的。我希望过滤到特定的区域，按年龄分组，然后将此信息提取为新的数据<

浏览 0提问于2019-04-04得票数 0

1回答

初学者R:使用事件数据，创建一系列包含分类变量和的新数据帧

我想创建一个新的数据帧序列，对未分组的数据进行分组(即，与此链接中的第一步相反：)。我希望数据帧包含上述最后两列中每一列的每个分类计数的每一年/每个州的总数(但每个年份-州组合只有一行)，因此它将是两个单独的数据帧： Year State Sum of Criminal OffenseOffe

浏览 0提问于2014-05-30得票数 0

1回答

pandas数据帧中的函数，用于复制R中的dplyr group_by(多变量)函数

、、、

考虑一下这种情况： df = df%>% group_by(a,b) %>% 表示数据帧首先按列a分组，然后按b分组。在我的例子中，我尝试先按group_name列、然后按user_name、再按type_of_work对数据进行分组。有三列以上(这就是我感到困惑的原因)，但我需要根据这三个标题以相同的顺序对数据</em

浏览 0提问于2017-06-19得票数 1

7回答

是否同时对列和索引值对pandas数据帧进行排序？

、、、

按列的值和索引对pandas dataframe进行排序是否可行？如果按列的值对pandas数据帧进行排序，则可以得到按列排序的结果数据帧，但不幸的是，您会看到数据帧的索引顺序与排序列的值相同。那么，我是否可以按列对数据帧进行排序，例如名

浏览 2提问于2013-11-29得票数 59

1回答

如果我有多个group by字段，如何从Dask DataFrameGroupBy中获取所有组？

、、

如何从分组数据框中获取Dask中的所有唯一组？假设我们有以下代码：我必须遍历所有组并处理组内的数据。我的想法是获得所有唯一的值组合，然后遍历集合并调用。对于他们中的每一个人。这不会很快，但希望能起作用..在Spark&

浏览 3提问于2018-02-20得票数 4

3回答

按组和列求最小值

、

我的数据的一个小样本如下所示：1 a 1 3 5.04.06 b 1 5 1.0 我想按组分组，为每个组找到包含两个组分数中最小组得分的行，然后得到包含最小值的</e

浏览 2提问于2020-09-12得票数 2

回答已采纳

1回答

为什么股票代码和日期不同？

、、

这是我使用Python的早期尝试。我正在从雅虎获得股票数据，但我可以看到股票代码，日期列标题低于高，低，开盘收盘价。import numpy as npimport pandas_datareader as pdr py.init_notebook_mode

浏览 3提问于2020-04-08得票数 2

1回答

基于pyspark的均值漂移聚类

、、、、

议程是对数据帧(以前是pandas，现在是spark)进行一些过滤，然后按user-ids对其进行分组，最后在顶部应用meanshift集群。我在分组数据上使用pandas_udf(df.schema, PandasUDFType.GROUPED_MAP)。但现在，最终输出的表示方式出现了问题。假设我们在输入数据帧中有两列：user-id和location。对于每

浏览 11提问于2019-05-14得票数 0

回答已采纳

1回答

创建新的Pandas分组对象

、、

在某些转换中，我似乎被迫脱离Pandas dataframe分组对象，而我想要一种返回到该对象的方法。给定一个时间序列数据帧，如果按数据帧中的一个值分组，我们将获得一个从键到数据帧的底层字典。因为结构是dataframe的关键，所以不能使用.from_dict()将该结构转换回Dataframe。据我所知，返回Pand

浏览 0提问于2014-05-06得票数 0

1回答

以最有效的方式对Pandas* Dataframe进行排序和过滤*

、

我想按列名'duration‘过滤，然后显示大于200的值。这只是数据集的一小部分。我有一个非常庞大的数据集。我可以使用dfdf.duration > 200。但是，这在整个数据帧上运行。有没有什么方法可以专门针对列持续时间，然后过滤数据，只显示列持续时间，而不引入新的数据帧。

浏览 24提问于2021-04-17得票数 0

1回答

如何将扩展窗口应用于groupby结果的名称？

、

我想使用pandas将数据帧按一列分组，然后对这些组运行扩展窗口计算。想象一下下面的数据帧： G ValA 1B 3C 5 C 7 我正在寻找的是一种按列G对数据进行分组的方法(结果是组['A', 'B', 'C'])，然后将函

浏览 14提问于2021-11-15得票数 0

回答已采纳

2回答

按数据帧中的每个组进行分组并获取其详细信息

、、、

我有一张这样的桌子： ---- ----- ---- ---- B 1 call 30 B 2 sadas 50 我需要先按用户分组，然后按周分组，并处理一些数据。需要在Pandas中这样做，在将其加载到<em

浏览 0提问于2017-04-23得票数 0

回答已采纳

点击加载更多