腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
使用
df
时
,
组
内
记录
数
不正确
,
groupby
、
我有以下修改过的代码,取自here,根据时间戳将行分成5秒
组
。
df
= pd.read_csv(file_name, delimiter=',')for gin
df
.
groupby
(pd.Grouper(freq='5s', key='dt')): pri
浏览 3
提问于2021-04-20
得票数 1
回答已采纳
1
回答
具有空值的每个
组
的Apache火花计数
记录
、
当我试图计算我看到的每个
组
的
记录
数
时
,带空的
组
没有
记录
,但这是
不正确
的。Name|| Andrei|| null||Grigorii|代码: .agg(functions.count("
浏览 2
提问于2017-12-27
得票数 0
回答已采纳
2
回答
Pandas %计算
、
、
我试图计算ID中
记录
数
的TypeB %,如下所示:Result :002 = (0/2)=> 100ID Type001 TypeB002 TypeA003 TypeBbyID =
df</e
浏览 1
提问于2017-01-19
得票数 3
回答已采纳
1
回答
迭代数据帧,用Pandas
GroupBy
.nunique分组列,并将分组数据帧列导出到多个.xlsx文件
、
、
、
我有一个包含超过300 k
记录
的excel文件,我试图根据列类型"Executive“将较小的数据子集选择为单独的.xlsx文件,每条
记录
都列在下面。有10种不同的办公类型,我可以看到
df
.
groupby
('Executive Office').nunique()正确地显示了这个计数。我知道循环中有些东西没有正确地读取我的
组
的结果,但我不太明白当它迭代数据帧
时
发生了什么。
df
= pd.read_excel(file.xlsx) execG
浏览 3
提问于2021-01-11
得票数 0
回答已采纳
1
回答
如何计算超过某一数值的均值的个数
、
问题是如何获取
df
和
groupBy
年龄得分平均值,并将其与
df
‘
groupBy
’.平均值进行比较,并对高于
df
‘Score’的结果进行计数。data.
groupby
(['age'])['Score'].mean()现在我如何比较总分的平均值,并按年龄计算结果
组
浏览 1
提问于2021-05-31
得票数 0
2
回答
基于变窗口的熊猫加权平均法
、
我想以基于“一天”的“周期”加权平均
数
作为窗口。窗口并不总是一样的。我如何计算熊猫的加权平均
数
?cycle':[34.1, 41, 49.0, 53.9, 35.8, 49.3, 38.6, 51.2, 44.8], In [5]:
df
浏览 1
提问于2016-04-14
得票数 0
回答已采纳
1
回答
Pandas -在分组后移动滚动和溢出到以下
组
、
、
我可能做错了什么,但我试图在对数据帧进行分组后计算滚动平均值(为了简单起见,我们在本例中
使用
sum )。直到这里,一切都运行得很好,但当我应用移位
时
,我发现值溢出到了下面的
组
中。如下例所示: import pandas as pd
df
= pd.DataFrame({'X': ['A', 'A', 'A', 'B', 'B', 'B', 'C', 'C
浏览 20
提问于2020-10-29
得票数 2
回答已采纳
2
回答
基于百分位
数
的类别分配
、
*** B a ***我想通过创建一个新的列来分配gdp (高,低),基于
组
内
百分位
数
的等级if i>p: else:<
浏览 2
提问于2017-09-03
得票数 1
回答已采纳
1
回答
计算匹配
组
的描述符
、
、
我正在与一只具有以下结构的熊猫DataFrame合作:import numpy as np 第二,我想对每一<em
浏览 2
提问于2019-10-06
得票数 0
回答已采纳
1
回答
在
组
内
计数不同的/非唯一的
、
、
我想在每一
组
中计算不同的元组
数
: 'b':,而
组
“B”有两个
组
。我试着
使用
df
.
groupby
(
浏览 0
提问于2016-09-05
得票数 2
回答已采纳
1
回答
如何堆叠两列进行分组?
、
、
我有以下DataFrame
df
,它表示一个包含节点A、B、C和D的图。每个节点属于一个
组
1或2:A B 1 1B1C D 2 2我需要计算不同的节点数和每组的边
数
。我也不知道如何计算
组
内
的边
数</
浏览 3
提问于2018-06-23
得票数 0
1
回答
为什么我用熊猫群()得到不同的
组
号,无论列选择与否?
、
我尝试
使用
numpy.size()来计算来自于Dataframe ()熊猫
组
的
组
大小,我得到了奇怪的结果。4 0.65 What A B C D1 22 2.0 2 >>>
df
.
groupby
('A',as_index=False)[
浏览 0
提问于2019-06-19
得票数 2
1
回答
大熊猫按其内容的任意条件对石斑鱼进行分类。
、
我希望按列对数据帧进行分组,然后按某些条件(在我的情况下,对
组
中的B列进行最大排序)对
组
(不在
组
内
)进行排序。我期待着这样的事情:我也试过:最后,我
使用
了@jezrael建议的解决方案(几乎)
df
[
浏览 0
提问于2019-08-05
得票数 1
回答已采纳
1
回答
当只有一个
组
时
,
Groupby
应用程序进行不必要的转置
、
、
当熊猫与一
组
动物一起进行分组申请
时
,它们的行为不一致: pd.DataFrame({'c1': [0, 0, 0], .apply(lambda
df
:
df
['c2']).shape等于(1, 3)(
浏览 2
提问于2020-05-30
得票数 3
回答已采纳
1
回答
为什么大熊猫成群的速度不同?
、
、
为什么在pandas中,从32m行数据帧中获取
组
的这三种方法的性能存在差异。
df
=
df
.
groupby
(["a", "b", "c"]).groups
df
=
df
.index
df
=
df
浏览 0
提问于2016-07-18
得票数 0
1
回答
满足条件时计算分位数
、
我的DataFrame看起来像这样:我在向DataFrame添加第一、第二、第三个四分位
数
时
遇到了问题。
df
_final['1st quartile'] = round(
df
_final.
groupby
('Cat')['CTR'].quantile(0.25),
浏览 4
提问于2019-12-16
得票数 0
1
回答
熊猫
groupby
.diff()不返回预期产出
、
、
、
我有一个外部
组
和一个内部
组
,我希望找到每个内部
组
内
的差异,取决于外部
组
。通常,我可以
使用
groupby
在每个外部
组
内嵌套内部
组
,但出于某种原因,
groupby
的diff函数返回一个平面向量而不是嵌套数组。,我只需
使用
groupby
In [19]:
df
.
groupby
(['outer','inner'])
浏览 1
提问于2019-01-19
得票数 0
回答已采纳
1
回答
按绝对值取群的N个最大值的平均值
、
'pear', 'peach'] * 6, 'values': np.random.uniform(-5,5,18), 'values2': np.random.uniform(-5,5,18)}我可以取每个fruit
组
的平均值如下:然而,对于每一
组
水果,我想取按绝对值排列的N个最大值的平均值
浏览 0
提问于2020-07-15
得票数 0
回答已采纳
1
回答
使用
组
内
表达式筛选DataFrame
假设我已经有一个谓词表达式,我如何
使用
该谓词进行筛选,但只在
组
中应用它?例如,谓词可能是将所有行保持在最大值或
组
内
。(如果有平
数
,可以将多行保留在一个
组
中。)根据我的dplyr经验,我认为我可以只
使用
.
groupby
,然后是.filter,但这是行不通的。import polars as plexpression = pl
浏览 2
提问于2022-02-12
得票数 0
回答已采纳
1
回答
在Pandas中
使用
groupby
、shift和rolling
、
、
、
我正在尝试计算
组
内
的滚动平均值。对于这个任务,我想要上面各行的滚动平均值,所以我认为最简单的方法是先
使用
shift(),然后执行rolling()。问题是,shift()将数据从先前的
组
中移位,这使得
组
2和
组
3中的第一行
不正确
。列'ma‘在第4行和第7行应该有NaN。如何实现此目的?import pandas as pd {"Group": [1, 2, 3, 1, 2, 3
浏览 36
提问于2020-06-07
得票数 3
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
Python之数据聚合与分组运算
Pandas与SQL的数据操作语句对照
盘点一个工作中Python自动化处理实战问题(中篇)
Python推导式循环遍历
Python基础——4 数据可视化(下)
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券