熊猫分组并计算百分比，同时保留NaNs

腾讯云

开发者社区

文档建议反馈控制台

首页

文章/答案/技术大牛

发布

1回答

、

所以我试着对它们进行分组和计数：这给出了这一点，而且很有用，因为我知道通过通道3收到的订单最多所以最后我可以得到一些百分比:通过渠道3，90%的用户下单，其中10%的用户下了订单，占所有订单的40%。如何包含NaN以便我可以计算百分比？

浏览 10提问于2017-08-16得票数 2

回答已采纳

1回答

大熊猫数据完整性的度量

、

我正在使用熊猫，我有一个包含20列和65行的数据集。我要做的是尝试测量数据的完整性。因此，我想检查NaN值相对于整个数据集的百分比。例如，我需要的输出是：数据集中NaNs的百分比是: 40% 通过执行以下操作，我计算了NaNs的数量：comp_df.isna().sum().sum()，并得到了776的结果。

浏览 6提问于2020-04-19得票数 1

回答已采纳

2回答

如何计算Pandas dataframe组中索引值或空值的数量

我正在尝试获取按月和年分组的Dataframe中某些变量的非空值的数量。counts_by_month=df[variable1, variable2].groupby([lambda x: x.year,lambda x: x.month]).count() 但我真的想知道每组中有多少值是NaNs因此，我还想计算每个变量中的Nans，这样我就可以计算每个组中丢失数据的百分比。我找不到函数来做这件事。或者，我可以通过计算组中的所有项目来达到同样的目的。那么NaN

浏览 1提问于2013-05-15得票数 8

回答已采纳

1回答

在计算标准差时忽略多个NaNs

、、、

我有以下的熊猫数据，其中包含大约5分钟的日内数据。DeltaBetweenClose是美国东部时间9:30开市当天第一个交易酒吧的NaN。.......................... 我正在尝试创建一个列CloseDelta_sd，该列计算按symbols分组的DeltaBetweenClose列的滚动标准差，该列查看前30条并计算标准偏差，而忽略NaNs。下面的尝试返回所有Na

浏览 0提问于2018-09-14得票数 2

回答已采纳

1回答

是否可以使用DataFrame.pct_change并保留所有列？

、

是否有一种方法可以在内部使用熊猫百分比变化函数(DataFrame.pct_change)，或者以某种方式保留初始数据的所有列？例如,创建一个熊猫系列的百分比变化值。但是我倾向于保留所有的列，并将百分比的变化作为一个额外的列添加--下面的代码片段可以工作w/一个不同的函数，但是inplace不是可用的参数。CH1['Area_SqM

浏览 17提问于2022-09-07得票数 0

回答已采纳

1回答

对于协方差计算，Apache治疗差异Pandas与MLLib的确切值是多少？

、、、、

implementation from: com.github.fommil.netlib.NativeSystemBLAS [ 1, 2, 3, 4, 6, 7, 8]])_7 350.0 350.0 NaN

浏览 1提问于2021-10-15得票数 4

1回答

大熊猫群体中的NaN值

、、、

我正在和一只熊猫DataFrame Top15合作，它包含了世界上15个国家的人口数据。

浏览 1提问于2016-12-23得票数 1

回答已采纳

2回答

熊猫，分组数据的算术运算

、、

假设我有一个熊猫数据框架，并且已经被分组为现在我要计算每个组a的b百分比，例如：P1, aaaa = 11/484、P1,可重复分组数据 

浏览 2提问于2022-05-10得票数 0

回答已采纳

1回答

如何在dask中实现相对频率函数？

、、、

我试图使用dask获取类别的计数和相对百分比，在下面的数据集中按标签进行分组，因此：a 1a 3 最后，使用计数和总数计算百分比。我对达斯克和熊猫很陌生，但我的方法似乎效率低下，所以想知道是否有更快的方法来做这个计算

浏览 1提问于2017-11-10得票数 1

回答已采纳

2回答

在熊猫中添加一个接一个的专栏

、、

我使用熊猫来处理具有以下结构的csv文件20040601,mark,80,10020040602,mark,60,100我想按日期对上述数据进行分组，然后计算每个日期的百分比，然后绘制它。import pandas as pdgrouped_by_date = data.groupby('

浏览 1提问于2014-06-05得票数 1

回答已采纳

10回答

让熊猫DataFrame to a dict and dropna

、

我有一些带NaNs的熊猫DataFrame。2:44,3:np.nan}}>>> data1 2 NaN3 4 NaN>>> data.to_dict()那么，如何从DataFrame

浏览 8提问于2014-09-25得票数 34

1回答

使用SQL计算留任/流失

、

我已经创建了一个派生表，它应该非常接近于计算流失，但似乎无法获得最终答案1448 2018-10 NULL 2018-112018-10 2018-11 2018-12 92%

浏览 0提问于2020-07-03得票数 0

1回答

与熊猫合并，同时将NaNs保留在底部

、、、、

- q E 7 - - G 也就是说，我希望行保持它们被添加的顺序，这样NaNs(-)就保留在底部。

浏览 0提问于2016-01-07得票数 0

1回答

将列表理解与iloc、isna()、sum()和if语句结合使用

、

我有一个熊猫数据与形状(5000，92)。其目标是遍历每一行，计算每一列并计数NaN值，如果NaN的个数大于88，则输出真假。工作守则如下：for i in range(0,len(df)): nans.append(False) nans.append(True)[False for i in rang

浏览 0提问于2019-02-06得票数 1

回答已采纳

1回答

大熊猫百分比计算

我有下表，我想用熊猫的产量来计算百分比。有人能帮忙吗？'Fault':[0,1,0,1], 'count':[41,1,24,1]}) 希望将数据按“Doc_no”分组

浏览 10提问于2021-08-30得票数 -2

回答已采纳

1回答

将用熊猫组计算的总和应用于小组的所有元素

、、、

我在使用熊猫模块。我的数据有5个字段。请建议我如何在一个帐户的所有行上应用sum。

浏览 3提问于2015-08-03得票数 1

回答已采纳

1回答

熊猫群群中忽略NaN的标准错误

、、、、

目前，我一直在按列索引对数据进行分组，取组的平均值，计算95%的置信区间，如下所示：import pandas as pd#Calculate 95% confidence interval for each groupnump

浏览 8提问于2013-08-04得票数 9

回答已采纳

1回答

绘制一个pandas数据框列的Matplotlib直方图，并用点表示另一个列的平均值

、、、

基本上有一个熊猫数据帧，看起来像这样： d = {'Percentage' : [8,20,24,27, 58], 'Assets' : [10,12,53,32,11]} a = a.map我知道我可以将资产列按照它们各自的百分比所在的存储箱进行分组

浏览 15提问于2019-03-05得票数 0

1回答

在matlab中进行MAPE计算时排除0

、

为了计算预测精度，我想计算MAPE(平均绝对百分比误差)。我在MATLAB中这样做如下所示：% Compute mean absolute percentpred is a matrix of predictions (one per column)

浏览 21提问于2017-01-13得票数 0

回答已采纳

2回答

如何按总数计算群，然后计算Pandas DataFrame列的百分比

、、

我按市政当局和PartyName分组，以获得市政当局每个党派的总选票，在我重新设置索引之后，看起来就像这样：4 BUF - Buffalo City DEMOCRATIC ALLIANCE 106790 我现在想要计算每个党派在市政总中所占的百分比，并且无法计算出如何生成每个市政当局的选票之和，这样我就可以计算百分比了。我觉得这在熊猫<

浏览 0提问于2021-08-13得票数 2

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云