Python Pandas复杂分组

文章/答案/技术大牛

发布

1回答

、、

Pete In 3/5/2004Mary In 1/2/2003注意，Joe没有"out“分组结果

浏览 0提问于2018-08-15得票数 0

回答已采纳

3回答

使用Pandas实现复杂的分组

、、、

我正面临这样一种情况:我需要按数据帧、按列“ID”进行分组，并计算该特定ID完成的总时间范围。我只想用ID计数来计算特定ID的date_open和data_closed之间的差值。

浏览 23提问于2020-01-30得票数 0

回答已采纳

2回答

熊猫pivot_table不分组

、、

在不提供分组的情况下，使用pandas.pivot_table计算整个表上的聚合函数的最佳方法是什么？(keys) File "/tool/pandora64/.package/python-2.7.5/lib/python2.7/site-packages/pandas/core/generic.py-2.7.5/lib/python2.7/s

浏览 10提问于2015-07-01得票数 2

回答已采纳

1回答

PySpark:带有标量Pandas的无效returnType

、、

from pyspark.sql.functions import pandas_udfimport numpy as npC:\opt\spark\spark-2.3.0-bin-hadoop2.7\pythonreturnType_placeholder) C:\opt\spark\spark-2.3.0-

浏览 2提问于2018-03-26得票数 5

回答已采纳

2回答

如何使用Spark/Python在组中枚举行？

、

我想枚举分组值，就像使用Pandas一样：火花/Python的一种方式是什么？

浏览 0提问于2016-03-09得票数 5

回答已采纳

1回答

python -熊猫- O()数据框架分组和求和的大O复杂性

、、、、

分组和求和是否增加了循环的大O复杂度？该循环已经具有O(n)的复杂性。分组和求和是否增加了这里的复杂性？有一个例子A=['A','B','C','A','B']n=

浏览 2提问于2016-11-03得票数 1

回答已采纳

1回答

类似这样的df_streaming： name height weighttom 175 110 tom 175 115 和cal_feature @pandas_udfreturn feature_df 我知道agg(functions.max("weight"))可以得到它，但是我还想在cal_feature中使用其他的pandas函数。spark-2.4.5 python-3.7.10

浏览 8提问于2021-06-16得票数 0

5回答

具有NaN (缺少)值的pandas GroupBy列

、、、、

我有一个在列中有许多缺失值的DataFrame，我希望按这些值进行分组：import numpy as npOut[4]: {'4': [0], '6': [2]}

浏览 225提问于2013-08-25得票数 211

1回答

Dask/Pandas是否支持基于依赖于其他行的复杂条件删除组中的行？

、、、

我正在使用Dask处理一堆csv格式的基于文本的记录，我正在学习使用它来解决内存问题太大的问题，并且我正在尝试过滤最符合复杂条件的组中的记录。到目前为止，我所确定的处理此问题的最佳方法是基本上使用Dash将记录分组为比特大小的块，然后用Python编写适用的逻辑： records在重要的情况下，复杂的标准围绕着剔除网页上基于整个组的链接url、链接文本和css选择器的有前途的链接。产生的Pandas分区对象非常小。(整个数据集都不是，因此我

浏览 6提问于2019-07-25得票数 0

1回答

如何用循环获得群键？

、

我需要对分组后的每一组做一些比较复杂的处理。在pandas中，可以这样写： pass 在极点时，groups函数返回一个DataFrame，但这不能方便地应用于for

浏览 7提问于2022-05-12得票数 0

回答已采纳

1回答

熊猫-多栏群

、

我试图按多个列进行分组，并将它们聚合，使它们在分组后成为一个列表。_python_agg_general(arg, *args, **kwargs) 2871 /usr/local/lib/python2.7/dist-packages/pandas/core/groupby.pyc in _python_agg_general(self, fun

浏览 0提问于2015-11-13得票数 3

回答已采纳

1回答

熊猫群的混乱--难以驾驭的类型

、、、、

使用Pandas数据帧按特性分组，我希望按列c_b分组，并计算列c_a和列c_c的唯一计数。输入文件，hello,python,numpy,0.0ho,c++,vector,0.0go/site-packages/pandas/core/frame.py", line 1997, in __getitem__

浏览 1提问于2016-08-27得票数 0

回答已采纳

1回答

如何绘制一个事件在时间序列中的频率？

、、、、

我有一个包含日期和质量虚拟对象(0或1)的数据框： unixTimestamp date quality 1 1290643200 11 25, 2010 1 3 1290556800 11 24, 2010 1 5

浏览 19提问于2018-12-27得票数 1

回答已采纳

1回答

将滴答数据转换为每日数据

、、

groupby函数只让我按unix秒进行分组。什么是获得每日收盘价和每天成交量之和的好方法？import pandas as pd datagr问题是它分组为Unix秒，由于时间的考虑，我不想使用任何超复杂</em

浏览 3提问于2014-03-02得票数 1

回答已采纳

4回答

我可以在Jython中运行numpy和pandas吗？

、、、

我们有一些Java代码想要用于我们计划用Python编写的新代码，因此我们对使用Jython感兴趣。但是，我们还希望在这段Python代码中使用numpy和pandas库来进行复杂的统计分析。可以从Jython中调用numpy和pandas吗？

浏览 0提问于2013-10-19得票数 12

1回答

如何使用python/mysql处理重复数据？

、

它从我的表Person中返回重复项的列表及其id：43 hudson34 roger89 kerry使用Python

浏览 3提问于2012-10-07得票数 0

1回答

python pandas分组优化

、、

我有一个包含许多行和列的大型数据帧，我需要按其中一列“group”进行分组。

浏览 1提问于2014-10-16得票数 0

3回答

复杂分离和分组显示百分比(Pandas/Python)

、、

困境：我有一个数据集df，在这里，我希望通过一个特定列中的复杂格式来分离和分组，并显示百分比。

浏览 5提问于2020-12-17得票数 1

回答已采纳

1回答

在python中将子类转换为维度

、、、

我在python和pandas库中查找了有关python中表的旋转，但还没有找到如何将行中的子类分组到新维度中的方法。我想用Python语言创建具有维度的4D数组--特征、日期和“单个”对象(A1、A2、A3、A4)。因此，rows子类被重新分组为具有额外维度的单个对象。谢谢！

浏览 13提问于2021-03-12得票数 0

1回答

使用python，使用dataframe.groupby().mean()对数据进行分组，但不能根据分组按列绘制

、、

我有下面的短python脚本，我正在尝试运行df = pd.read_csv (r'usa survey data edited.csv') import matplotlib.pyplot.3.10_qbz5n2kfra8p0\LocalCache\local-packages\Python310\site-packages\pandas\core\frame.py", line 3805.3.10_qbz5n2kfra8p0\LocalCache\

浏览 5提问于2022-10-16得票数 0

点击加载更多