Pandas: Groupby，循环和添加一小时迭代，条件在组内_在groupby中迭代时，使用函数中的组名将列添加到pandas数据帧中 - 腾讯云开发者社区

python、pandas、loops、date、group-by

我有一个如下的df，每个人都有一些重复的日期记录，我希望保持其余数据的完全相同的顺序/顺序，但希望只为重复的日期记录增加一个小时。 df = pd.DataFrame({ 'Polo', 'Polo', 'Polo', 'Polo

浏览 3提问于2020-07-10得票数 3

回答已采纳

1回答

如何加快大熊猫数据帧的数据标注速度？

python、pandas、dataframe

0.324348 -0.842357 0.970825 我需要能够根据不同列中的分组对数据进行分类，例如，如果periods列中有x到y个周期，我的分类标准之一就是用标签标记identity列中的每个组。']==i]['periods'].max() <= 5) : df.loc[df['Identity']==i,'label']='label 1' 我还尝试了一个版本，使用 df.groupby代码运行大约需要5分钟，对我来说，这表明是

浏览 44提问于2021-04-20得票数 2

回答已采纳

2回答

如何迭代从groupby().size()生成的熊猫序列

python、pandas

如何遍历由.groupby('...').size()命令生成的Pandas Series并获得组名和计数。举个例子，如果我有：-1 7 1 14我如何循环它们，使得每次迭代都有-1 & 7，0& 85，1& 14和2&5的变量？示例： for i, row in enumerate(df.groupby(['foo'

浏览 4提问于2016-07-15得票数 59

回答已采纳

1回答

如何在Python Pandas中进行嵌套循环类型的操作？

python、pandas、dataframe、loops、subset

我需要找到一个子集的子集，并且需要迭代地进行，然后在这个子集的每个实例上计算一个值，然后将其保存到一个新的输出表中。为了更好地解释，我有一个类似于下图所示的数据框；我需要迭代数据集，并对团队A(组2)的所有人员1(组1)的成本求和。我的理解是使用嵌套循环，如下所示： for Person in Group1: output.append(Person, Team, Newcost) 然而，我是Python和

浏览 18提问于2020-08-24得票数 0

1回答

提亚诺-按组分列

python、theano

我正在为Theano做一个自定义的似然函数(试图拟合一个条件logistic回归)。编辑以获取更多详细信息在潘达斯，这将是： temp = df.<em

浏览 6提问于2016-06-13得票数 2

回答已采纳

1回答

在群Pandas的第一行上开始迭代

python、pandas

我试图迭代每个客户的每个员工的每个策略(客户可以有多个员工，员工可以有多个策略)，并将覆盖日期与特定员工的失效日期进行比较。如果覆盖日期和失效日期在5天之内，我想将该政策添加到结果列表中。因此，预期产出将是：123 | 1234 | 1234 因为保险单123的失效日期是在第124号保单承保日期后的5天内。我在试图迭代每组客户/员工编号时遇到了一个问题。我能够识别每个E

浏览 2提问于2017-03-01得票数 1

回答已采纳

2回答

熊猫:如何在一列中检查重复值，并从另一列创建值的成对列表

python、pandas、dataframe

38 300 9我希望能够检查A列中的重复值(在这里重复200和300)，然后从B列中的值中输出成对值的列表，这些值与A列中的重复值位于同一行，如下所示：元组中数字的顺序并不重要，即(5,3)和(3,5)一样好。

浏览 0提问于2015-03-13得票数 1

回答已采纳

2回答

在groupby* with pandas图之后进行子图绘制*

python、pandas、pandas-groupby、subplot

1 1 3 43 1 3 42 2 4 5 3 2 4 5 我想画出a和b我设法做到了这一点，分别创建轴并按照建议的here对组进行迭代。但是我想使用plot函数的subplots参数来避免循环。我尝试过这样的解决方案 df.groupby("grp").plot(subplots=True) 但它将组绘制在不同的子图中，并且删除<

浏览 30提问于2020-11-25得票数 0

回答已采纳

2回答

分组/拆分DataFrame并将其保存到现有excel文件中，而不会擦除数据

python、pandas、pandas-groupby、openpyxl

globfrom openpyxl.utils.dataframe import dataframe_to_rows import pandas如何按DataFrame编写和拆分/分组，并将其保存在单独的文件中。

浏览 0提问于2020-06-11得票数 0

1回答

删除groupby并优化pandas代码

python、pandas

我正在尝试替换for循环，以便在pandas中获得更好的性能。在pandas中使用for循环是性能杀手，请在许多博客中阅读它。现在，我必须应用一些逻辑来设置项目和按emp_id分组。代码块如下所示。我不能确定删除groupby，有没有其他技术可以让我获得更高的性能？emp_groups = self.df.groupby("emp_id") fo

浏览 4提问于2020-11-16得票数 0

1回答

大熊猫按其内容的任意条件对石斑鱼进行分类。

pandas、pandas-groupby

我花了太多的时间在一些琐碎的事情上。df.groupby('A').sort_index(lambda group_content: group_content.B.max())groups = df.groupby但是，当然，没有按对象对一个组的so

浏览 0提问于2019-08-05得票数 1

回答已采纳

2回答

Pandas中的GroupBy和Cut

python、pandas

我正在尝试对一组东西进行分组，并根据( min和max)值的最小值、最大值和平均值动态地在组内执行剪切。Tanzania 780 Uganda 213Kenya 524 Tanzania 780 (780, 879) Tanzania 978 (879,

浏览 0提问于2018-05-09得票数 2

回答已采纳

1回答

通过group BY子句获取每个GROUP的行可迭代数

python、group-by、sqlalchemy

我知道如何为选择中的所有行获取一个迭代器，但我想在选择中添加一条GROUP BY语句，并返回一组可迭代程序，每组一个。也就是说，假设我有一个表，如下所示： ? 假设我想要按nationality进行分组；我想要一组可迭代的(例如，可迭代的)，其中包含以下行：[1, 3], [2, 5], [4, 6], [7] (没有特定的顺序)。目前，我在nationality上使用order_by手动完成此操作，并迭代所有行；是否有使用sq

浏览 6提问于2020-06-26得票数 0

1回答

在特定的时间范围内过滤重复

pandas、datetime、duplicates

我要做的是在1小时内找到打过3个或3个以上电话的号码。我的数据包括2列，‘日期时间’和‘电话号码’。

浏览 1提问于2022-08-07得票数 0

回答已采纳

1回答

熊猫:组群和在组内迭代条件？

python、pandas、loops、group-by

我有一个比较棘手的迭代问题，我在实现上遇到了困难。所以在我的例子中，机会？列等于吉姆的1，因为Metric_LHS(吉姆)>Metric_RHS(杰克)<e

浏览 0提问于2018-09-19得票数 5

回答已采纳

1回答

函数，用于在Pandas中设置字符串的条纹。

python、pandas

我有一个df与艺术家的名字在一栏，我想知道多少次艺术家重复通过该列。", "Dire Straits"]})用法：我对此代码的关注是：这是我可以想到的检查当前迭代器项与前一个

浏览 0提问于2018-10-02得票数 2

回答已采纳

2回答

熊猫数据群+应用+新列慢

python、performance、pandas、group-by、apply

我使用groupBy (on 1列)+ apply组合来向dataframe添加一个新列。apply使用参数调用自定义函数。条件，新列中填充了1或0。这些是我的数据的统计数据: dataframe有3130行和49列。groupBy生成1499个单独的组。如果我在customFunction中输出一些调试文本，我观察到通过每个组的实际迭代速度相当快，但是在结束时需要更长的时间(比迭代本身长)，直到<

浏览 4提问于2017-07-16得票数 1

回答已采纳

1回答

pandas groupby上的Double for循环

python-3.x、pandas、pandas-groupby

我正在尝试基于某个键对两个数据帧进行成对比较，但我很难在double for循环中使用pandas groupby，因为它非常慢。有没有什么方法可以优化我，使我不必每次运行外部循环时都重新计算组？我尝试使用相同的groupby变量，但它似乎不能解决重新计算问题。mygroups = mydf.groupby('mykey') for key2,subdf2 in my

浏览 15提问于2019-08-30得票数 0

回答已采纳

3回答

如何在python中通过变量中的不同值来创建bin？

python、pandas

vodafone 562 reliance 5054 mts 10 我需要的是，如果短信文本值在0-10之间，二进制名应该是10，如果短信文本值在11-50之间，二进制名应该是50，如果短信文本值在51-100之间，二进制名应该是100，如果短信文本值在101-500之间，二进制名应该是500，如果短信文本值在500-1000之间，二进制名应该是1000，如果短信文本值在1

浏览 0提问于2015-04-03得票数 0

1回答

群比和移动平均函数在熊猫中起作用，但速度慢

python、performance、pandas

我收集了很多人(超过5万人)在两年内每隔一天收集的一些时间序列数据。我想对数据集中的每个人和每个度量应用指数加权移动平均函数。在计算移动平均值之后，我想要将新值与dataframe中的现有值连接起来。特别是当我试验不同的跨度和聚合水平时。如何优化此代码以更好地扩展到更大的数据集？import pandas as pdfrom datetime import datetime vals = ['Atim

浏览 0提问于2017-11-16得票数 1

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云