Groupby不会返回以前的df，而不会更改它

df=pd.read_csv('../input/tipping/tips.csv')df_1.head() 伙计们，我错过了什么？因为它返回给我之前没有groupby的数据帧

浏览 21提问于2021-11-10得票数 1

回答已采纳

1回答

pyspark groupby使用字符串groupby键在输出中生成多行

、

pyspark groupby操作不会为大型数据集生成唯一的组键spark.conf.set("spark.sql.exe

浏览 12提问于2019-11-12得票数 0

回答已采纳

2回答

Groupby/聚合显示以前应该过滤掉的组

、、

我有一个带有Size栏的熊猫Size，我先在它上过滤，然后按组分组并计数记录。结果还包含以前过滤掉的组的行，但计数为0： df[df["Size"].isin(("XXS", "XS", "S", "M", "L", "XL", "XXL"))] .groupby在我对<em

浏览 8提问于2022-11-18得票数 0

回答已采纳

4回答

火花放电中groupBy后的列别名

、、、、

我需要下面行中的结果数据帧，以便在groupBy之后的max('diff')列中有一个别名“diff”。但是，下面的行不会进行任何更改，也不会抛出错误。grpdf = joined_df.groupBy(temp1.datestamp).max('diff').alias("maxDiff")

浏览 0提问于2015-11-04得票数 46

回答已采纳

1回答

根据水年计算平均、最大和最小值

我可以根据一年的第一天作为1月1日计算出年平均值、最大值和最小值，例如： yearly_sum=df2.groupby(years).sum() yearly_MIN=df2.groupby(years).min() 我需要根据10月1日是一年中的</

浏览 1提问于2019-11-04得票数 0

回答已采纳

2回答

在python中对group by使用条件滚动计数

、

1 Active 1 Active 2 Paused 2 Active 预期输出是基于计数器的新列，该计数器使用group by id，并在类别更改时重置计数器。= df['Category'].shift(-1) df['count'] = np.where(m, df.groupby(m.ne(m.shift(),'Id'

浏览 23提问于2020-12-14得票数 0

1回答

如果我想在熊猫的csv文件的一个部分分割数据，在同一个csv文件中的另一列，我如何做到这一点？

、

好的，我正在做一个熊猫程序，按月绘制平均温度数据，但在做之前，我需要弄清楚如何将数据按月分成一组，并显示平均温度。然而，当我尝试这样做时，它一直在显示所有的数据，而不是将其分割并显示平均值。我不能真正显示输出，因为它基本上是整个csv文件，这将占用太多的空间。import pandas as pd df = pd.read_csv('louisville_weather_data.csv', u

浏览 1提问于2021-11-12得票数 1

回答已采纳

2回答

大型数据仓库上的Pyspark

、、、

我们有一个非常大的，我们需要在它上执行一个groupBy操作。我们试过了它花了很长时间(它已经运行了超过17小时，但没有结果)。我也试过但据我所知，这种行为是一样的。我在不同

浏览 0提问于2020-08-27得票数 0

1回答

如何确保熊猫数据在传递到函数后不被更改

、、

我使用的是不太小的df (1.7GB+，包含python对象)，这需要我做大量的计算，并返回一个字符串列表。但是，正如 of pd.copy中提到的，深度复制不是递归的，这意味着我的df中的python对象可能会在函数中被更改。问题是，因为我必须经常调用函数，而且由于df的大小，所以每次调用函数时都要深入复制每个列，这不是一个选项。是否有任何提示、技巧、测试方法

浏览 10提问于2022-03-03得票数 0

回答已采纳

1回答

无法使用带有lambda函数的熊猫群内的.size() .div()方法

、、、

我使用下面的代码行来计算条件概率 probs = df.groupby(variable).size().div(len(df))cond_probs = df.groupby([variable, 'has_income']).size().div(len(df)).div(probs, axis=0, level=variable，作为每个组的示例大小，但是

浏览 2提问于2019-07-03得票数 0

回答已采纳

5回答

更改“熊猫数据”中预选元素中的列

、、

我们有一个有三个不同列的dataframe，如上面的示例(df)所示。此任务的目标是将列2的第一个元素替换为np.nan，每次在列1中的字母发生更改时。由于所研究的数据库非常大，因此不能使用for循环。而且，每一个涉及转移的解决方案都被排除在外，因为它太慢了。我相信最简单的方法是使用groupby和head方法，但是我不知道如何在原始的dataframe中替换。, 'X&

浏览 1提问于2018-09-09得票数 4

回答已采纳

1回答

如何摆脱标题上面的"chaning“行(每次长度都会改变，但标题和数据总是相同的)

、、、

我有以下csv文件：df = pd.read_csv('payments.csv')print df.groupby('sku').size() df = df[df[

浏览 0提问于2017-09-03得票数 0

1回答

在通过DataFrame.groupby.apply调用的函数内部更新pandas数据帧

、

这似乎是一个以前会被问到的非常基本的问题，但我找不到答案。但是，这是可行的： ### Attempt #5 -- This one我误解了groupby吗？我认为它

浏览 0提问于2018-09-25得票数 0

1回答

我有一个df，它没有排序，大约有750,000行。现在，我想按mrwSmpVWi对df进行分组，并获得mrwSmpP的平均值。例如:我有2,000个mrwSmpP值用于mrwSmpVWi = 3，我想得到2,000个值的平均值。如果我对每一个x值都有一个y值，我想用另一个组来绘制它，即列Seriennummer。for number in df.groupby('mrwSmpVWi'): df['

浏览 2提问于2020-10-02得票数 0

回答已采纳

1回答

熊猫组内过滤器

、、

数据不会更改。我的功能很好。如果在循环中插入print，就可以看到过滤的结果。我读过医生的书，但看上去我对此视而不见。编辑import numpy as np df = pd.DataFrame({'gr' : ['foo', 'bar&#x

浏览 0提问于2016-05-17得票数 0

回答已采纳

1回答

cuDF: Pandas + Shift的另一种选择？

、、

我有一个DF，我想使用Groupby + Shift。我可以在熊猫上这样做，但我不能在cuDF中这样做，因为它还没有实现:参见问题。特性请求是很久以前的，所以他们似乎不会在不久的将来实现这个功能。

浏览 5提问于2021-03-30得票数 0

回答已采纳

1回答

Cumsum with groupby

、、、

cumulative sum，并尝试了以下内容： df['Total'] = df.groupby(['State','Country'])['Cases'].cumsum() 返回一系列-1 df['Total'] = df.groupby(['State', 'Country']).sum() \

浏览 7提问于2020-12-27得票数 0

1回答

Python熊猫群按对象应用方法添加索引

、、

我有这个问题是在阅读了之后的一个扩展。return df.iloc[:]print "======"如预期所示：0-----1 4 5 6======0 1 2 3但是，当我尝试只返回<

浏览 1提问于2015-11-05得票数 2

回答已采纳

1回答

循环中的TryCatch -R

、

我的初始循环如下： strikeTMP <- df$`Exercise price, riskfreerateTMP, maturityTMP, 0.4) 这个循环返回一个直到某一行的值。我想对它使用TryCatch，所以我尝试了以下方法。但是，它不会对以前的结果进行任何<

浏览 2提问于2018-10-31得票数 0

2回答

尝试在pandas中使用aggregate sum函数

、、

我有一个dataframe，我试着将它按恐怖分子和日期分组，然后在剩下的两个列FATALITIES & INJURED上运行一个聚合sum函数。问题是，当我运行代码时，它不会将数字相加，而只是将它们连接在一起。例如，下面是我的代码： df_3 = df_2.groupby(by=['TERRORIST','DATE']).agg({'FATALITIES': 'sum','

浏览 30提问于2019-02-25得票数 0

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

pyspark groupby使用字符串groupby键在输出中生成多行

Groupby/聚合显示以前应该过滤掉的组

火花放电中groupBy后的列别名

根据水年计算平均、最大和最小值

在python中对group by使用条件滚动计数

如果我想在熊猫的csv文件的一个部分分割数据，在同一个csv文件中的另一列，我如何做到这一点？

大型数据仓库上的Pyspark

如何确保熊猫数据在传递到函数后不被更改

无法使用带有lambda函数的熊猫群内的.size() .div()方法

更改“熊猫数据”中预选元素中的列

如何摆脱标题上面的"chaning“行(每次长度都会改变，但标题和数据总是相同的)

在通过DataFrame.groupby.apply调用的函数内部更新pandas数据帧

为每个x值绘制y值的平均值

熊猫组内过滤器

cuDF: Pandas + Shift的另一种选择？

Cumsum with groupby

Python熊猫群按对象应用方法添加索引

循环中的TryCatch -R

尝试在pandas中使用aggregate sum函数

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐