pandas DataFrame中组内相对大小的计算_pandas中子组内的计算操作_Pandas:计算组内的连续True值 - 腾讯云开发者社区

python、pandas、dataframe

我有一个每日大小的DataFrame size，基于第二个DataFrame group，我尝试计算每天组内的相对大小。size = pd.DataFrame({ 'Date':['2021-01-01', '2021-01-02', '2021-01-03', '2021-01-04', &

浏览 33提问于2021-11-19得票数 0

回答已采纳

1回答

Pandas dataframe组内的计算

python、dataframe、pandas-groupby

我有Pandas Dataframe，如下所示。我要做的是，partition (or groupby) by BlockID, LineID, WordID，然后在每个组中使用current WordStartX - previous (WordStartX+ WordWidth)派生另一列，例如，WordDistance来表示这个单词与前一个单词之间的距离。这篇文章非常有用，但在我的例子中涉及多个列(WordStartX和WordWidth)。

浏览 1提问于2016-11-08得票数 2

回答已采纳

1回答

为什么dataframe会变成一个系列？

python、pandas、dataframe、series

为什么下面的函数groupby().size()将dataframe更改为一个系列？在第一行中，我返回info()函数的结果，但在第三行，我收到一个错误。“串联”对象没有属性'info‘。df_injury_record.info())print(test.info()) 当我想要将它放在dataframe中时，这个函数是什么样子的？

浏览 0提问于2020-01-25得票数 0

回答已采纳

1回答

频率和百分比不均匀组sns条形图

python、python-3.x、pandas、matplotlib、seaborn

我试图在sns柱状图中显示每个组的相对百分比以及总频率。我比较的两个组在大小上非常不同，这就是为什么我在下面的函数中按组显示百分比的原因。下面是我创建的一个样本数据帧的语法，它在目标分类变量('item')中具有与我的数据(‘group’)相似的相对组大小。‘'rand’只是我用来

浏览 12提问于2017-06-26得票数 5

回答已采纳

1回答

Pandas DataFrame -将行拆分为n个窗口，按m个元素移动窗口，查找平均值

python、pandas、dataframe

我有一个DataFrame，该列包含(例如) 30行，您需要将它们拆分为5个元素的窗口，将每个窗口相对于另一个窗口移动4个元素，并沿行找出平均值。应该还剩下10行。窗口的行数和大小可以是任意的。在pandas中，有没有一种移动窗口和计算值的机制？

浏览 4提问于2021-02-16得票数 2

2回答

如何在忽略空值的情况下获取列中每个组的计数

python、dataframe、pandas-groupby

我尝试在忽略空值的情况下获取列中每个组的计数。2 yy 163 xx 123 null 12A B2 3使用的代码

浏览 21提问于2020-11-12得票数 0

1回答

熊猫群群中忽略NaN的标准错误

python、numpy、pandas、scipy、nan

我已经将数据加载到具有多个列标题索引的dataframe中。目前，我一直在按列索引对数据进行分组，取组的平均值，计算95%的置信区间，如下所示：import pandas as pdci = grouped.aggregate(lambda x: st.sem(x) * 1.96

浏览 8提问于2013-08-04得票数 9

回答已采纳

1回答

使用Python Pandas使用每日数据计算的月平均值

python、pandas、time-series

我有一个包含四列的文本文件:年、月、日和积雪深度。这是30年内，1979-2009年的每日数据。我想使用熊猫计算360 (30年x 12个月)个人月平均值(即隔离1979年1月-1979年，1979年2月-1979年的所有值，...2009年12月-2009年12月，平均每个月)。

浏览 2提问于2015-04-21得票数 8

回答已采纳

1回答

Pandas dataframe的群内计算

python、pandas、grouping、dataframe

我有以下形式的数据：AA 201205 1AA201410 7BB 201309 1日期是yyyymm的形式我希望根据“code”列中的值对数据进行分组，并将过去6个月和之前所有时间的每个代码值的计数值

浏览 0提问于2014-10-19得票数 1

回答已采纳

1回答

如何在spark中使用pandas split-apply-combine风格策略和scala api？

pandas、scala、apache-spark、split-apply-combine

我有一个scala函数，它接受一个spark dataframe并返回一个单值，也就是说两个值。这个函数很复杂，使用在DataFrame类中定义的聚合，调用其他java库，并且不能用SQL表达。它需要整个数据帧的内容来进行计算，它不能一次添加一行并建立一个结果。我有一个大的dataframe，其中包含一个列，我想用它将dataframe分成小块，并对每个小块执行上述计算。然后，我想返回一个新的数据

浏览 28提问于2020-04-22得票数 0

1回答

为什么matplotlib.pyplot.savefig()会给非常大的pandas.plotting.scatter_matrix()图像输出造成混乱？

python、pandas、dataframe、matplotlib

我试图为非常大的pandas.plotting.scatter_matrix()计算pandas.DataFrame()值(相对地说，对于这个特定的操作，大多数库要么大部分时间运行OOM，要么实现50000我想要的Q1 我尝试使用matplotlib和modin.pandas.DataFrames对每对进行循环，通常(如文档中的示例所示)，所以我想要做的索引和操作/<

浏览 1提问于2021-07-29得票数 0

回答已采纳

3回答

如何将Dask.DataFrame转换为pd.DataFrame？

python、pandas、dask

如何将生成的dask.DataFrame转换为pandas.DataFrame (假设我已经完成了繁重的任务，只想将sklearn应用到聚合结果中)？

浏览 27提问于2016-08-18得票数 43

回答已采纳

2回答

在pandas.DataFrame中查找下一个值组的行号

python、pandas、dataframe

我有一个数据框架，其值分组如下：A = pandas.DataFrame([['a',0],['b',1],['ba',1],['c',2],['cd',2],columnsvalue group23 b 112 c 2我跟踪组的行号cur

浏览 2提问于2019-03-01得票数 0

回答已采纳

1回答

Partition上的聚合- pandas Dataframe

python、pandas、group-by、dataframe、partition

我正在寻找基于特定分区聚合值的最佳方法，它相当于在Pandas中，我可以通过以下步骤做到这一点，但我正在寻找一种我确信应该存在的本机方法 TempDF= TempDF.reset_index

浏览 2提问于2016-03-10得票数 23

1回答

我如何在金字塔框架内的请求之间缓存/记忆pandas DataFrame (昂贵的计算)？

python-3.x、pandas、pyramid

()我有一个计算命中率的类。计算和数据检索过程相当昂贵。因此，对于给定的一组参数，我希望持久化"calculate_hits“的结果。我希望这样做，以便在片刻或几个小时后再次需要这些结果时，不需要再次进行计算和检索。我天真地尝试将输出结果放入金字塔框架内的会话对象中。这不起作用，因为熊猫数据帧太大了…(可能还有其他问题)。[有关其他上下文:我正在<e

浏览 14提问于2017-02-15得票数 1

回答已采纳

1回答

使用pandas数据帧高效地搜索数据

pandas、dataframe、search

10个客户的详细信息，并将它们放入3个不同的新csv文件中。也就是说，对于每个客户(从10个客户)，我想从file1的cust_id，fname，lname，并将结果放在新的csv文件中，cust_id，prod_id，价格，日期从file2放在新的csv文件中的结果，prod_id，prod_code，价格，数量从file3放在新的csv文件中的结果。代码： import <em

浏览 19提问于2020-08-06得票数 0

1回答

如何使用dataframe列值作为键将dask dataframe转换为字典

dictionary、dask-dataframe

将熊猫作为pd导入df =pd.DataFrame(数据){'a'：1，2，'b'：3，4}ddf = from_

浏览 4提问于2022-08-16得票数 -1

3回答

Python Pandas:当分组和N>组大小时如何采样？

python、pandas、pandas-groupby

我想从一个分组的熊猫DataFrame中采样，其中的组大小有时小于N。在下面的示例中，当组大小为3时，我如何采样3，否则组中的所有成员？我正在尝试下面的方法，但我得到了一个错误消息：“当‘replace=False’时，不能接受比总体更大的样本”。import pandas as pd df = pd.DataFrame({

浏览 0提问于2017-10-25得票数 1

1回答

Pandas groupby:获取一个组的大小，知道它的id (来自.grouper.group_info[0])

python、group-by、pandas

在下面的代码片段中，data是一个pandas.DataFrame，indices是data的一组列。使用groupby对数据进行分组后，我对组的I感兴趣，但只有那些大小大于阈值的组(比方说: 3)才感兴趣。group_ids=data.groupby(list(data.columns[list(indices)])).grouper.group_info[0] 现在，我如何知道哪个组的<

浏览 5提问于2013-07-30得票数 19

回答已采纳

2回答

如何在Pandas中过滤Groupby标准？

python、pandas、pandas-groupby

假设下面的设置是人为的：d = {'fname': ['bob', 'Bob', 'larry', 'LARRY', 'Larry', 'Dick'],(df.fname.str.lower()) 简单地说，我想为名字在查询中的

浏览 1提问于2017-10-24得票数 1

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云