在pandas/sql中如何按层次数据分组？

在pandas/sql中，可以使用groupby函数按层次数据进行分组。

在pandas中，可以使用groupby函数将数据按照指定的列或多个列进行分组。首先，需要导入pandas库：

import pandas as pd

然后，可以创建一个DataFrame对象，表示要进行分组的数据集。假设我们有一个包含层次数据的DataFrame，其中包含两列：'A'和'B'。我们可以按照'A'列和'B'列进行分组，如下所示：

df = pd.DataFrame({'A': ['foo', 'bar', 'foo', 'bar', 'foo', 'bar', 'foo', 'foo'],
                   'B': ['one', 'one', 'two', 'two', 'two', 'one', 'two', 'one'],
                   'C': [1, 2, 3, 4, 5, 6, 7, 8],
                   'D': [10, 20, 30, 40, 50, 60, 70, 80]})

接下来，可以使用groupby函数按照'A'列和'B'列进行分组，并对分组后的数据进行聚合操作。例如，可以计算每个分组的平均值：

grouped = df.groupby(['A', 'B'])
result = grouped.mean()

上述代码将按照'A'列和'B'列进行分组，并计算每个分组的平均值。结果将是一个新的DataFrame对象，其中包含分组后的数据和对应的平均值。

在SQL中，可以使用GROUP BY子句按照指定的列或多个列进行分组。假设我们有一个名为table_name的表，其中包含'A'列和'B'列。我们可以按照'A'列和'B'列进行分组，并对分组后的数据进行聚合操作。例如，可以计算每个分组的平均值：

SELECT A, B, AVG(C) AS avg_C, AVG(D) AS avg_D
FROM table_name
GROUP BY A, B;

上述SQL语句将按照'A'列和'B'列进行分组，并计算每个分组的'C'列和'D'列的平均值。结果将包含分组后的数据和对应的平均值。

总结起来，在pandas和SQL中，按层次数据分组的步骤如下：

导入pandas库（对于pandas）或连接到数据库（对于SQL）。
创建一个DataFrame对象（对于pandas）或指定要查询的表（对于SQL）。
使用groupby函数（对于pandas）或GROUP BY子句（对于SQL）按照指定的列或多个列进行分组。
对分组后的数据进行聚合操作，如计算平均值、求和等（对于pandas和SQL）。

对于pandas，可以参考以下链接了解更多关于groupby函数的详细信息和用法：

pandas官方文档 - groupby

对于SQL，可以参考以下链接了解更多关于GROUP BY子句的详细信息和用法：

SQL教程 - GROUP BY

页面内容是否对你有帮助？

有帮助

没帮助

在pandas/sql中如何按层次数据分组？

python、sql、pandas、postgresql、group-by

我有一个关于层次结构的问题。我有这样的数据。performance_rating是他的评分(满分10分) parent_id是在相应id之上工作的人的id。我需要找出单个树的平均评分(111,122,123)。我尝试的是根据级别分离数据帧。

浏览 6提问于2019-05-02得票数 2

1回答

如何使用python/mysql处理重复数据？

python、mysql

我有一个sql查询，它从我的表Person中返回重复项的列表及其id：43 hudson34 roger89 kerry 403

浏览 3提问于2012-10-07得票数 0

1回答

熊猫-按每一种可能的键组合进行汇总

python、python-3.x、pandas、dataframe

我有一个DataFrame Pandas，我想用A、B、C和D列的组合尽可能地按数据分组。X Y U V 1 1 14 X Z Z Z 1 8 1 首先，我试着在更高的层次上分组，所以我试着按'A'，'B'，'C'，'D‘分组。最后，我没有使用组

浏览 2提问于2018-02-20得票数 3

回答已采纳

6回答

如何在非唯一列中按日期对pandas DataFrame条目进行分组

python、pandas

Pandas DataFrame包含名为"date"的列，该列包含非唯一的datetime值。我可以使用以下命令对此帧中的线条进行分组：但是，这将按datetime值拆分数据。我想按“日期”列中存储的年份对这些数据进行分组。展示了如何在将时间戳用作索引的情况下按年分组，但在我的例子<em

浏览 1提问于2012-07-09得票数 94

回答已采纳

1回答

`static_frame.Series`索引上的"Groupby“功能

python、static-frame

使用pandas.Series，我可以这样做： agg_series = series.groupby(level=1).sum() 如何使用static_frame执行相同的操作我在the groupiterator functions下查找，但它们不允许您按索引层次结构级别进行分组。我也许可以将其转换为sf.Frame，按索引列分组，然后转换回sf.Series；但这需要大量的工作，例如。与上面的pandas等价物相比。如果没有

浏览 8提问于2019-04-22得票数 1

回答已采纳

2回答

按数据帧中的每个组进行分组并获取其详细信息

python、sql、pandas、dataframe

40 B 1 should 20我需要先按用户分组，然后按周分组，并处理一些数据。需要在Pandas中这样做，在将其加载到数据帧之后，我将数据按用户和周分组，我不知道如何在分组后访问数据。此外，一旦

浏览 0提问于2017-04-23得票数 0

回答已采纳

1回答

按两列排序，为什么不先分组呢？

python、sql、pandas、sorting、group-by

我想要做的是按客户对数据进行分组，然后在组内对销售进行排序。在SQL或Pandas中，这通常是通过表上的order by customer, sales实现的。但我只是对这个实现很好奇。与其先对customer排序，然后对sales排序，为什么不先对customer进行分组，然后对sales进行排序。我真的不关心不同客户的顺序，因为我只关心同一客户被分组在一起的记录。分组本质上是映射，应该比排序运

浏览 13提问于2018-01-03得票数 0

2回答

两栏一组，熊猫一栏

pandas

在熊猫中，我想按两栏分组，然后做一次计数。在此之后，我想删除我分组的列，并计算计数的平均值。我知道如何在sql中轻松地做到这一点，但是在Pandas中遇到了一些问题。我不能删除我以前分组的一列。有人知道如何做得好吗？YorkCarl, New YorkCarl, London

浏览 9提问于2022-10-10得票数 1

回答已采纳

2回答

将XML与Linq分组，层次结构是不正确的

c#、xml、linq、treeview

我正在设法从asp.net C#中的sql查询中创建treeview菜单。作为一个学习练习，我有一个包含过去三年假期的数据库--我想创建一个treeview，显示按年排序的假期。例如，“年份->假日名称->假日日期”，其中“->”表示层次级别。无论如何，我将使用以下查询将假期作为XML文档从SQL返回： SELECT [Year], [Holiday], [Date] FROM [Database] FOR XML PATH(&#x

浏览 0提问于2015-01-22得票数 1

回答已采纳

2回答

按日期分组Pandas DataFrame

datetime、python-2.7、group-by、pandas

我有一个Pandas DataFrame，其中包含一个date列。该列的元素类型为pandas.tslib.Timestamp。做了非常类似的事情，但是我不理解代码，它使用datetime对象。在</em

浏览 6提问于2013-11-21得票数 10

回答已采纳

2回答

用PySpark进行组索引

pyspark、apache-spark-sql、pyspark-pandas

我怎么能像这样在level=0中分组呢？我在文件里没有发现任何好的东西。如果你有提示的话，我会非常感激的！

浏览 9提问于2022-10-04得票数 0

回答已采纳

1回答

RadGrid自定义聚合:我在哪里？

c#、asp.net、telerik-grid

我有一个雷达网格，需要多个级别的分组，到处都是聚合体。这些聚合中有几个是自定义聚合，这是我必须做的第一个定制聚合。我看到每个自定义聚合都会触发OnCustomAggregate事件:对于层次结构中任意分组中的每个自定义聚合列，以及网格的“总计”页脚。我的问题是:在我的CustomAggregate事件处理程序中，如何知道网格请求的是什么组聚合？例如，如果我的数据是按国家分组的，那么按</em

浏览 5提问于2014-05-21得票数 1

回答已采纳

2回答

在WPF树视图中对数据进行分组

c#、wpf、data-binding、treeview、observablecollection

我想创建一个带有两个分组选项(单选按钮)的WPF TreeView。因此，数据将以两种不同的方式在两级层次结构中进行分组，最低级别是实际的数据项，而分组只是为了更容易理解而表示数据的一种方式。他们还可以按组(复选框)选择项目，但我已经弄清楚了这一点，例如，如果我想表示数据库对象，并希望按模式或对象类型(表、视图、函数等)对它们进行分组。我只是不知道如何开始使用这

浏览 0提问于2010-07-16得票数 5

回答已采纳

1回答

SQL中的多对多层次关系

sql、database、hierarchical-data

我正在试图找出如何在数据库中存储分层数据，但我遇到了麻烦，因为数据似乎不适合简单的树层次结构。我在看市场指数和分指数，它们可以用多种不同的方式、多个不同的层次来划分。我试着用一个简单的例子来解释。我希望能够检索各种不同的索引分组方法。下面是一些示例：按国家、部门分组：{

浏览 0提问于2018-01-19得票数 0

1回答

按Tensorflow数据集进行分组和排序

python、tensorflow2.0

我希望按键对tensorflow dataset中的行进行分组，并按值选择组中的顶k行。这是很容易做到的前任。在Pandas或SQL中，但在TF中不太明显。我在tf.experimental 和中找到了，但是我不知道如何按照特定的列对数据集进行排序。我的数据集对行具有Dict结构。假设我想按'id‘分组，然后在每个组

浏览 13提问于2022-05-05得票数 0

2回答

pandas中带有分区的SQL groupby

python、pandas、dataframe、group-by、pandas-groupby

现在我有了这样一个SQL语句，我想知道如何在Pandas中编写它，也许可以使用groupBy和apply?y = group['A']这将生成一个没有A列的数字序列，该序列用于按on进行分组。我希望有一个数据帧作为输出，A也是一个单独的列，就像我写的SQL语句一样。有人能帮我回答这个

浏览 15提问于2018-01-22得票数 0

3回答

Pandas Dataframe按多列分组，然后求和

python、arrays、pandas、aggregate-functions

假设每个Python代码都有以下内容：import numpy as npgrpA = df.groupby('A')但是，如果除了数组列之外还有多个其他列，比如另外两列，那么当尝试按前两列分组并对数组列求和时2, 4]),np.array([2,

浏览 8提问于2015-09-03得票数 2

2回答

MDX:如何聚合同名的层次结构级别成员

mdx

大家好，[Segment].[Flow].[Segment Week][Week- 1][Week- 3][Week- 2]成员具有相同

浏览 0提问于2010-03-17得票数 1

1回答

在pyspark中保持至少有一个元素满足条件的组

python、pandas、pyspark

我一直在尝试用pyspark重现一些在Pandas中很容易做到的东西，但我现在已经挣扎了一段时间。2 53 1 195 2 7 和列表 l = [5,1] 我尝试做的是按a进行分组，如果b中的任何元素都在列表中，则为该组中的所有值返回True。然后，我们可以使用结果来索引数据帧。中的可重现数据帧： from pyspark.<e

浏览 8提问于2020-11-04得票数 2

回答已采纳

1回答

从熊猫到pandas_udf转换申请

apache-spark、pyspark、user-defined-functions、pandas-udf

如何将以下示例代码转换为pandas_udf： some code that applies to each row(非分组)，该函数适用于熊猫数据的每一行，并生成一个输出。理想情况下，我将df_contracts_courses作为火花数据，并将pandas_udf函数直接应用到它。我试着编写，将一个单调递增的ID添加到spark，并根据该ID进行分组，并将panadas应用于<

浏览 14提问于2022-10-17得票数 1

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

在pandas/sql中如何按层次数据分组？

相关·内容

在pandas/sql中如何按层次数据分组？

如何使用python/mysql处理重复数据？

熊猫-按每一种可能的键组合进行汇总

如何在非唯一列中按日期对pandas DataFrame条目进行分组

`static_frame.Series`索引上的"Groupby“功能

按数据帧中的每个组进行分组并获取其详细信息

按两列排序，为什么不先分组呢？

两栏一组，熊猫一栏

将XML与Linq分组，层次结构是不正确的

按日期分组Pandas DataFrame

用PySpark进行组索引

RadGrid自定义聚合:我在哪里？

在WPF树视图中对数据进行分组

SQL中的多对多层次关系

按Tensorflow数据集进行分组和排序

pandas中带有分区的SQL groupby

Pandas Dataframe按多列分组，然后求和

MDX:如何聚合同名的层次结构级别成员

在pyspark中保持至少有一个元素满足条件的组

从熊猫到pandas_udf转换申请

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐