腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
2
回答
Pandas
groupby
mean
通过
指定
最小
数量
的
非
NA
值
来
表示
、
我知道,如果它是滚动窗口平均值计算(例如df.rolling(5).
mean
()),那么我将在rolling()中有一个可选参数,它允许我
指定
计算平均值所需
的
有效(
非
NA
)
值
的
最小
数量
;如果至少有与
指定
一样多
的
非
NA
值
,则返回平均值,否则返回NaN
值
。当使用
groupby
/ resample时,我正
浏览 58
提问于2021-02-20
得票数 1
回答已采纳
1
回答
在固定行数内查找平均值--行范围
的
开始取决于是否存在
非
NA
值
此外,如果行范围(窗口)不包括
最小
数量
的
非
NAs,则会返回
NA
。这是一个包含原始数据集和所需结果数据集
的
玩具示例,其中窗口长度为5,
非
NAs
的
最小
所需
数量
为3,Score是要求平均值
的
变量,Person是分组变量。
NA
值
开始 对于人员1,窗口从第一行开始(遇到第一个
非
NA
分数),并在第五行结束,得到
的
平均值为5
浏览 13
提问于2019-11-21
得票数 1
回答已采纳
2
回答
如果超过90%
的
特征在熊猫中丢失,该如何降低整个记录?
、
、
、
、
我有一个名为df
的
熊猫数据栏,有500个栏和200万条记录。但是,如果90%或更多
的
栏在整个记录中缺失了
值
,我如何才能将整个记录降到熊猫中呢?
浏览 8
提问于2022-04-05
得票数 0
回答已采纳
2
回答
Python堆叠到
非
堆叠格式
、
、
10 13 MOBILE NOKIA 其中,我希望将TYPE列转换为每个唯一
值
的
新列, **kwargs) File "/usr/local/lib/python2.7/dist-packages/
pandas
/core/
groupby
.py", line 3179, in aggregate
浏览 23
提问于2017-03-16
得票数 2
回答已采纳
2
回答
在df agg()函数中计算NaN
的
最简单
的
方法是什么?
、
、
、
、
我想在agg()函数后面添加一个列,其中包含
非
NaN
的
数量
。"len“不区分NaNs和
非
Nans。在下面的示例中,我探索了np.sum和np.
mean
只使用
非
NaNs
的
事实。但一定有更好
的
方法
来
达到同样
的
结果?import
pandas
as pddf = pd.DataFrame({'a': [1, 1, 1, 0, 0, 0]
浏览 0
提问于2020-07-31
得票数 0
1
回答
python中
的
条件
groupby
、
、
我正在处理一个名为Ozon
的
数据帧。它有一个名为O3
的
列和一个DatetimeIndex。现在我创建了一个新
的
数据帧,这样我就可以获得每天
的
平均ozon
值
: dailymeanozon = ozon.
groupby
(pd.Grouper(freq='1D')).
mean
() 这工作得很好,但是在某些日子里,(正确
的
)臭氧测量值真的很少。因此,在某些日子里,日平均ozon
值
并不具有全天
的
代表性。因此
浏览 12
提问于2020-12-17
得票数 0
回答已采纳
1
回答
dplyr不按R中
的
意图分组
、
,
NA
,
NA
,
NA
,
NA
,
NA
,
NA
,
NA
,
NA
,
NA
,
NA
,
NA
,
NA
,
NA
,
NA
,
NA
,
NA
,
NA
,
NA
,
NA
,
NA
,
NA
,
NA
,
NA
浏览 2
提问于2015-11-24
得票数 0
回答已采纳
3
回答
使用
pandas
GroupBy
.agg()对同一列进行多个聚合
、
、
、
、
pandas
有没有一种内置
的
方法,可以在同一列df["returns"]上应用两个不同
的
聚合函数f1, f2,而不必多次调用agg()?示例数据帧:import datetime as dtdf = pd.DataFrame:df.
groupby
("
浏览 0
提问于2012-09-26
得票数 190
回答已采纳
5
回答
仅考虑百分位数范围内
的
值
来
估计DataFrameGroupBy
的
平均值
、
、
、
、
我需要
通过
只考虑给定百分位数范围之间
的
值
来
估计熊猫DataFrameGroupBy
的
平均值。pd.DataFrame(a)m1 =
groupby
.
mean
()m1 = 1 2 2.333333 但是,如果选择百分位数范围
来
排除最大
值
和
最小
<em
浏览 7
提问于2018-11-13
得票数 3
回答已采纳
1
回答
通过
使用lapply和dplyr跨多个列
的
分组列计算描述性统计数据(
mean
,sd,n),从而得到
NA
值
、
、
我有一个
表示
组成员资格
的
Group列,以及许多其他包含数值
的
列。对于包含数值
的
每一列,我希望获得每个子组
的
平均值、标准差和样本大小。R提供了大量
的
警告消息,例如: 在
mean
.default(noquote(x),
na
.rm = T)中:参数不是数字或逻辑
的
:返回
NA
在is.data.frame(x)中:
通过
强制引入
的
NAs 但是我也尝试过使用across函数,但结果显然是错误<
浏览 21
提问于2021-07-06
得票数 1
回答已采纳
2
回答
用熊猫工具箱对不缺失列
的
平均值进行条件计算
、
这个问题集中在熊猫自身
的
功能上。仍然有解决方案(),但有自己编写
的
函数。在SPSS中,有一个函数
MEAN
.n,当该列表中
的
n元素有效时,它给出了数字列表
的
平均值,只有 (not
pandas
.
NA
)。使用该函数,只有在
最小
数量
的
项是有效
的
情况下,才能计算缺少
的
值
。有熊猫做这件事
的
功能吗?
值
[1, 2, 3, 4, <em
浏览 4
提问于2022-01-08
得票数 1
回答已采纳
1
回答
h2o.ai摘要函数与group_by不兼容
、
、
、
我试图(实质上)
通过
移动到R+h2o.ai
来
加速一些R代码。在h2o中是否有与拆分应用-组合方法不兼容
的
摘要函数列表?temp <- h2o.group_by(data=df.hex,
mean
proc_cols_list),
浏览 0
提问于2019-02-18
得票数 0
回答已采纳
1
回答
理解.
groupby
().first()在压缩
Pandas
DataFrame时
的
含义?
、
、
对于单个行,实际
值
(在可用
的
情况下)是存在
的
,而不是NaN (即
NA
):我从中得到了答案,我应该使用.
groupby
(...).first() -'> (1): [[79423, <
NA
>, <
NA
>, 5]]由此,我推断--从本质上说,
groupby
('event')为“eve
浏览 1
提问于2020-04-11
得票数 1
回答已采纳
3
回答
R:具有某一因子水平
的
所有情况
的
平均值
、
、
我试着从这里
Mean
by factor by level代码,但它不工作。这是我
的
情况。从航班数据集中,我想知道UA航空公司所有飞机
的
平均航班延误。library(nycflights13)
mean
(flights$air_time[flights$carrier == "UA"]) 但是结果就是 [1]
NA
我做错什么了
浏览 11
提问于2020-06-19
得票数 2
回答已采纳
7
回答
Python中
的
plyr或dplyr
、
、
、
、
这是一个概念性
的
问题,我没有具体
的
问题。df[...].
groupby
(.....).sum() only sums columns, 而在R上,我可以有
浏览 6
提问于2014-11-12
得票数 21
回答已采纳
1
回答
按列和连接结果计算大熊猫DataFrame组
的
最小
最大
值
中值
、
、
我有一个熊猫DataFrame,我想在一个列上执行
最小
,最大,平均,中值
的
计算,用A,B和C列对它们进行分组,然后我想将结果合并到初始
的
DataFrame。当我计算中间
值
时,我成功地使用了低音:用于
最小</
浏览 1
提问于2019-08-06
得票数 3
回答已采纳
1
回答
熊猫:一组接一组地使用
最小
等级
、
、
、
我知道rank方法存在于
pandas
.DataFrame.
groupby
中,但我想知道是否可以使用
最小
rank方法
来
获得与R编程语言中针对以下问题
的
结果相同
的
结果。复制到我
的
github
的
数据集是几MB。我
的
尝试:import
pandas
as pd flights = pd.read_csv('https://github.com/
浏览 0
提问于2019-04-24
得票数 1
回答已采纳
1
回答
带dplyr但跳过所有缺失
值
的
群
的
线性插
值
、
我试图使用dplyr和大约()对组中
的
值
进行线性插
值
,不幸
的
是,其中一些组
的
值
都丢失了,所以我希望近似直接跳过这些组,然后继续处理其余
的
值
。我不想推断或使用最近
的
邻近观测数据。id,year,valuec1,1999,
NA
c1,2
浏览 1
提问于2016-05-23
得票数 2
回答已采纳
1
回答
当每个字典
的
一个条目本身是一个数组时,从字典列表中创建python大熊猫数据
、
、
、
但是,这个列表
的
一个条目本身就是一个数组(或者可能是一个
pandas
.Series)。我需要分组和平均,但我无法让它开始工作。.95},df=pd.DataFrame(ls) 我可以
通过
执行
来
执行数字
值
n和
浏览 3
提问于2014-04-18
得票数 0
回答已采纳
1
回答
如何重用df.
groupby
()
的
结果。你是说在另一个数据集里填南安?
、
、
、
我根据“性别”和“Pclass”计算df['Age']
的
平均值,以填充df['Age']中
的
NaNs。守则如下:df = pd.read_csv('train.csv') df['Age'] = df.
groupby
(['Sex','Pclass'])['Age'].transform(lambda x:x.fillna(x.
mean<
浏览 2
提问于2019-12-30
得票数 2
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
Python基础——4 数据可视化(下)
Python Pandas模块数据统计与分析常用方法
Python之数据聚合与分组运算
Pandas 2.0 vs Polars:速度的全面对比
给 iOS 开发者的 python 学习日记十三
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券