Pandas:聚合后每组的计数器列

、

这里是pandas和dataframes的新手！A 1238 100 C 2

浏览 2提问于2020-01-24得票数 2

1回答

更改DataType的GroupBy方法

、

使用Python3和Anaconda，我在ipython上导入了pandas和os。我有一个非常大的csv文件。在对文件使用read_csv之后，我尝试对两列使用.groupby()，但它将数据类型从DataFrame更改为DataFrameGroupBy，并且我不能再对其运行数据框方法。我想不出任何可以尝试的东西。我对熊猫的经验很少，通过codecademy获得的。我的代码似乎可以在那里工作。import os import pandas as pd

浏览 19提问于2019-06-21得票数 0

回答已采纳

1回答

自定义分组pd.df，以向量化方式计算OHLC

、、、、

我想要打开/高/低/关闭数据帧的区块，其中df.volume >= threshold。可重现的例子： df = pd.DataFrame(index=pd.date_range('2018-01-02', periods=10000, freq='ms'),2 52018-01-02 00:00:00.004 42 32 我可以通过迭代iterrows()获得想要的结果，这是非常慢

浏览 18提问于2020-10-05得票数 1

1回答

此R聚合的等效pandas函数

、

我有一个包含lon、lat和label列的dataframe dfmean_labels <- aggregate(cbind(lon, lat) ~ label, data据我所知，它正在计算df中每组label值的lat、lon值的平均值然而，我不确定如何使用pandas数据帧来实现这一点。我可以很容易地按label进行分组，但我不知道如何计算每个组中的平均lon和lat值。

浏览 3提问于2013-07-13得票数 2

回答已采纳

1回答

无法在groupby().count()之后执行命名聚合

、、、

我有一个有两列的数据框。我需要按其中一列进行分组，然后找到行数最多的组和该组的名称。我想要以下输出，以及命名的聚合： Max IDy = np.random.randint(0,5,size=(100, 2)idxmax')) TypeError: aggregate() missing 1 required positional argument: '

浏览 10提问于2021-09-18得票数 0

回答已采纳

1回答

Pandas GroupBy聚合不保留数据类型

我通过使用sum、max和min等函数将Pandas GroupBy和Groupby.agg用于我的数值列，但我注意到以前强加给我的列的数据类型(如np.int8、np.int16、np.int32)在GroupBy聚合后不会保留，实际上每一列都被覆盖为int64。Pandas版本1.1.5 我目前的解决方案是在完成groupby聚合后重新转换，这是一个已知<em

浏览 19提问于2021-03-16得票数 1

回答已采纳

3回答

SQL Server :具有相同ID的SUM列

、

浏览 42提问于2020-04-19得票数 0

2回答

Pandas中每组聚合的重采样

、

对于每个ID，我需要每两天聚合一次A和B。 ID A B date 0C0003fi8E 16如果我想用更灵活的时间周期重新取样呢？例如，每一个周，还是每一个月？可以用于此吗？

浏览 5提问于2015-11-12得票数 3

回答已采纳

0回答

Pandas:聚合后维护列

、

我有一个如下所示的数据：用于构建它的代码如下： Data_aggr = Data.groupby('Cu

浏览 0提问于2018-07-12得票数 0

回答已采纳

1回答

不带GROUP BY的SQL SUM

我已经编写了一个SQL SELECT来总结临时表的内容。+FROM cte; (在原始代码中，我正在读取的表比Change有更多的列(它实际上是MERGE语句的输出，我记录了MERGE所做的事情)，但如上所述，我只引用SELECT中的一列。这是可行的</em

浏览 5提问于2018-01-26得票数 0

2回答

Power Query中每行一个唯一表达式的计数器

、、

我尝试为我的表中的唯一表达式获取一个计数器。我的表看起来像这样：我需要这个计数器来旋转表格，然后区分多个答案。因此，下一步是透视索引<em

浏览 0提问于2021-04-12得票数 0

1回答

是否按每一行或每组进行手术？

、、

SQL中的within子句是以每一行或每组为基础的吗？还是只删除不满足指定约束的整个组？

浏览 0提问于2018-11-22得票数 0

回答已采纳

2回答

如何在基于MySQL的应用程序中有效地在用户上存储多个不同的计数器值？

、

现在我的问题是如何处理：我看到的缺点是每次单个计数器递增时用户表上的行锁定。c)有一个单独的计数器表，其中包含3列(用户to、名称、

浏览 6提问于2012-11-26得票数 1

1回答

如何在Postgres中基于一个值进行计数？

、

我有以下数据，我想在JobName上做分组，但我需要所有的数据列。 JobName rule name …….

浏览 24提问于2021-02-08得票数 0

回答已采纳

2回答

熊猫中的变性人群

、

假设我有一个Pandas DataFrame，它的数据看起来像import pandas as pd df = pd.DataFrame({'a''b': np.random.choice([0, 1, 2], n),问:如何改变组(按b列分组不是每组中的置换，而是在组水平上的

浏览 3提问于2016-04-05得票数 1

回答已采纳

1回答

按加入日期分列的用户总数

是否有任何函数或节点会按时间顺序添加集合中的元素数？我试着找这个，但没有找到任何相关的东西。新来的。谢谢。

浏览 1提问于2018-06-21得票数 0

回答已采纳

2回答

熊猫问题产生两个集合，一个有条件地创建。

、

我有如下所示的数据格式：a 0b 0a 1我在这里的目标是按label列分组，并获得两个聚合列。a:2，b:4)第二，每组中val = 1的比例。在熊猫中，最好的方法是什么？

浏览 0提问于2019-05-14得票数 1

回答已采纳

2回答

如何在jupyter中有条件地格式化pandas行组

、、

我在pandas中有一个数据帧，看起来有点像这样： A B C1 0.7 0.13 0.10.3 3 0.2 0.1 在jupyter中打印熊猫数据帧时，默认输出样式是使用交替的浅色和灰色背景对每行进行着色。我希望能够调整每组列A值的背景颜色，以便每组都有一个交替的配色方案。因此与默认样式类似，除了每行背景不是灰色和白色交替，而是由来自列

浏览 19提问于2019-08-27得票数 2

回答已采纳

2回答

聚合R中每个组的唯一字符值

、、、

我想聚合所有的关键字在一个特定的一年中，每组。对我来说，主要的问题是单词列可以在1到52之间变化！我正在考虑将这个列拆分成不同的列，然后使用group_by。

浏览 0提问于2018-08-31得票数 1

回答已采纳

2回答

在Python Pandas中，如何使用like R dplyr mutate_each

、、、

在Python Pandas中，我想通过对多个列执行多个聚合函数来添加列，比如R mutate_each。例如，Python Pandas能否实现与以下R脚本相同的处理？%>% mutate_each(funs(min, max, mean), starts_with("Sepal")) 然而，我能够实现与使用Pandas的变异体相同的处理。如下面

浏览 3提问于2017-10-18得票数 5

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

更改DataType的GroupBy方法

自定义分组pd.df，以向量化方式计算OHLC

此R聚合的等效pandas函数

无法在groupby().count()之后执行命名聚合

Pandas GroupBy聚合不保留数据类型

SQL Server :具有相同ID的SUM列

Pandas中每组聚合的重采样

Pandas:聚合后维护列

不带GROUP BY的SQL SUM

Power Query中每行一个唯一表达式的计数器

是否按每一行或每组进行手术？

如何在基于MySQL的应用程序中有效地在用户上存储多个不同的计数器值？

如何在Postgres中基于一个值进行计数？

熊猫中的变性人群

按加入日期分列的用户总数

熊猫问题产生两个集合，一个有条件地创建。

如何在jupyter中有条件地格式化pandas行组

聚合R中每个组的唯一字符值

在Python Pandas中，如何使用like R dplyr mutate_each

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐