在groupby函数之后从dataframe获取信息

、、、

我正在尝试获取特定列中的最大值。在那之后，我是具有所有属性的对应行值。我该怎么做呢？SYM NUM DATEA 4 5B 7 13SYM NUM A

浏览 2提问于2017-12-31得票数 0

3回答

如何在groupy group的第一个值之前取值

、、、

在对我的数据应用groupby之后，我想保存一些值。我在dataframe中有两列: x1和x2。按x2列应用groupby函数，在group的第一个值之前从x1获取值。df=pd.DataFrame({'x1':[3,4,5,6,7,8,9,2,7],x2:[1,3,3,3,2,2,2,2]})0 3 12 534

浏览 0提问于2019-08-15得票数 2

1回答

如何将pandas.core.groupby.groupby.DataFrameGroupBy转换为dataframe？

、、

我在DataFrame上应用了groupby，之后它将DataFrame转换为pandas.core.groupby.groupby.DataFrameGroupBy格式。如何将pandas.core.groupby.groupby.DataFrameGroupBy转换为常规DataFrame，或者如何从pandas.core.groupby.groupby.Da

浏览 7提问于2018-10-27得票数 1

1回答

在R中做dt[，y:=myfun(x)，by=list(a，b，c)]是怎样的？

、、

假设我有一个具有列x, a, b, c的数据框架，并且我希望通过a, b, c进行聚合，以便通过函数myfun从x的列表中获得一个值y，然后复制每个窗口/分区中所有行的值。在data.table中的R中，这只是一行：dt[,y:=myfun(x),by=list(a,b,c)]。在Python中，我想到的唯一方法是这样做： class Record: def __init__(self, x,we have a list of

浏览 0提问于2013-12-06得票数 7

回答已采纳

2回答

在应用函数pandas python中包含组名

、、、

是否可以指定groupby()调用在apply() lambda函数中使用组名？类似于如果我遍历组，我可以通过以下元组分解获得组键： printgroup_nametemp_dataframe.groupby(level=0,axis=0).

浏览 0提问于2015-09-08得票数 29

回答已采纳

1回答

如何在Pandas中通过分区计数

、、

下面窗口函数的pandas等效项是什么我可以得到row_number或排名 df['row_num'] = df.groupby

浏览 1提问于2019-09-11得票数 4

1回答

minBy等价于Spark

、、

我正在寻找minBy聚合在Spark中的等效功能，或者可能需要手动聚合。有什么想法吗？谢谢。

浏览 2提问于2018-07-25得票数 2

1回答

在熊猫群中迭代组时丢弃行

、

对于如下所示的数据集：df = DataFrame(te, index = range(6))在groupby函数之后，我想通过A和iter进行分组： for i, row in group.iterrows():if row['B&#

浏览 0提问于2016-06-17得票数 0

回答已采纳

1回答

如何从每个组中获取行子集

、、

给定熊猫DataFrame的groupby对象by_name，我希望能够从每个组中选择n行。 'name': ['Tom', 'John', 'Tom', 'Tom', 'John'],} by_

浏览 3提问于2014-02-05得票数 0

回答已采纳

2回答

当使用'df.groupby( column ).apply()‘时，在'apply’上下文中获取groupby列？

、、、

我想在groupby (即df.groupby(by=column).apply(Here))之后的apply上下文中获取groupby列，即作为by参数(即df.groupby(by=column))提供给df.groupby的列。例如, df = pd.DataFrame({'Animal': ['Falcon', 'Falcon',

浏览 43提问于2021-10-17得票数 1

回答已采纳

2回答

为什么groupby操作的行为不同？

、、、

在使用和在groupby之后操作输出时，我注意到一些函数在作为索引返回的内容以及如何操作这两个方面有不同的行为。假设我们有一个包含以下信息的数据：0 Book1 ebook 12 Book3 paper 34 Book2 paper 2df.groupby(["Name", "T

浏览 1提问于2020-05-15得票数 3

回答已采纳

2回答

从Spark GroupedData对象中选择随机项目

、、、

我刚开始在Python中使用Spark，并且一直无法解决这个问题:在pyspark.sql.dataframe.DataFrame上运行groupBy之后df.groupBy('teamId') 如何从每个结果组(按teamId分组)中选择N随机样本而不进行替换？我基本上是尝试从每个团队中随机选择N用户，也许一开始使用

浏览 0提问于2015-11-17得票数 21

回答已采纳

2回答

Python:如何从一列中找到唯一日期的计数

、

-04 38 Green Widget 2020-06-01 7 嘿，伙计们，所以我想要做的是从Python语言中唯一的"order_dates“中获取日期的计数。所以这个是从2020-06-01到2020-06-04，所以数到4。我希望能够将它保存到一个变量中，谢谢。

浏览 3提问于2020-06-12得票数 0

2回答

计算Spark DataFrame中分组数据的标准差

、、

为了利用SparkSQL查询功能，我从csv中获取了用户日志，并将其转换为DataFrame。单个用户每小时将创建多个条目，我想为每个用户收集一些基本的统计信息；实际上只是用户实例的计数、平均值和许多列的标准差。我能够通过使用groupBy($"user")和带有用于计数和平均的SparkSQL函数的聚合器快速获得平均值和计数信息： val meanData = selectedData.groupBy($"userdur

浏览 1提问于2015-08-03得票数 22

回答已采纳

1回答

在groupby之后迭代dataframe列

、、

我正在对user_id列做一个groupby，并且能够成功地做到这一点。如何在groupby结果之后检索列数据。我的csv列如下所示：，user_id，statusimport csv#writer = csv.writer(open("rewww.csv",

浏览 5提问于2016-02-21得票数 0

回答已采纳

3回答

PYTHON:如何将同名的项添加在一起，并将它们添加到列表中，以便找到列表的长度？

、、、

我在一个文件中有一个不同动物的列表，该列表在一个函数中打开并读取。例如，我的列表是： Cats, Dogs, Cows, Cows, Cows, Sheep, Dogs, Sheep, etc.此外，因为它是在一个函数中，所以我不能对每个动物都进行具体说明。

浏览 20提问于2019-03-19得票数 0

1回答

"Groupby“到多个数据帧

、、

我从SQL中提取数据，并以以下格式获取数据：我尝试使用"Groupby“函数，为每个标识符创建唯一的Pandas Dataframe，如图所示。因此，我希望将所有内容都保持在一个循环中，例如：for i in (0, "Number of Unique Identifier"): Dataframe_i= Hist_Prices.groupby('Ele

浏览 12提问于2020-02-14得票数 0

1回答

无法使用Pandas数据帧对聚合后的值进行排序

、、、

我有以下数据帧： df[['ID','Team']].groupby(['Team']).agg([('total','count')]).reset_index("total").sort_values

浏览 66提问于2020-09-17得票数 1

回答已采纳

1回答

更改DataType的GroupBy方法

、

使用Python3和Anaconda，我在ipython上导入了pandas和os。我有一个非常大的csv文件。在对文件使用read_csv之后，我尝试对两列使用.groupby()，但它将数据类型从DataFrame更改为DataFrameGroupBy，并且我不能再对其运行数据框方法。import os band_gaps = totals.groupby

浏览 19提问于2019-06-21得票数 0

回答已采纳

1回答

用pd.DataFrame.sample实现基于群的dask数据挖掘

、、、

但是，我在groupby应用程序方面遇到了挑战。实际的dataframe非常大，有许多列，而且在任何人建议之前，这个方法比索引上的np.random.choice方法要快一些--它都在groupby中。'] = N ValueError:元数据推理在groupby.apply(sample)中失败。您已经提供了一个自定义函数，Dask无法确定该函数返回的输出类型。若要解决此问题，请提供一个meta=关键字。您运行的Dask函数</e

浏览 4提问于2020-08-05得票数 1

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

如何在groupy group的第一个值之前取值

如何将pandas.core.groupby.groupby.DataFrameGroupBy转换为dataframe？

在R中做dt[，y:=myfun(x)，by=list(a，b，c)]是怎样的？

在应用函数pandas python中包含组名

如何在Pandas中通过分区计数

minBy等价于Spark

在熊猫群中迭代组时丢弃行

如何从每个组中获取行子集

当使用'df.groupby( column ).apply()‘时，在'apply’上下文中获取groupby列？

为什么groupby操作的行为不同？

从Spark GroupedData对象中选择随机项目

Python:如何从一列中找到唯一日期的计数

计算Spark DataFrame中分组数据的标准差

在groupby之后迭代dataframe列

PYTHON:如何将同名的项添加在一起，并将它们添加到列表中，以便找到列表的长度？

"Groupby“到多个数据帧

无法使用Pandas数据帧对聚合后的值进行排序

更改DataType的GroupBy方法

用pd.DataFrame.sample实现基于群的dask数据挖掘

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐