腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
pandas
中
groupby
和
agg
并行
的
一种
有效
方法
、
、
、
我想要
并行
化以下函数并加速
groupby
过程: df = pd.DataFrame({'A': ['a', 'a', 'b', 'c', 'b', 'b'], 'B': ['e1', 'e1', 'e2', 'e3', 'e4', 'e2'], 'C':[[1,2
浏览 30
提问于2021-03-01
得票数 0
2
回答
Pandas
Groupby
-命名聚合输出列
、
我有一个
pandas
groupby
命令,如下所示:在
groupby
命令
中
,有没有
一种
方法
可以将
agg
输出命名为'users‘以外
的
名称?我可以在
groupby
完成后重命名该列,但不知道是否有其他<e
浏览 22
提问于2016-01-29
得票数 4
1
回答
将PySpark
groupby
collect_set迁移到Dask
、
、
pySpark实现: df.
groupBy
('Key').
agg
(collect_set('ColumnA').alias('Items'), collect_set('ColumnB').alias('DocumentId')) 到
Pandas
df.
groupby
("Key")[['ColumnA','ColumnB']].
agg
(set).r
浏览 31
提问于2021-08-16
得票数 0
2
回答
Python熊猫在多个列上执行相同
的
聚合。
、
、
我知道在熊猫
中
,我可以这样做,将多个聚合应用到相同
的
专栏
中
df = pd.DataFrame({'id':[1,1,2,2], 'x1':[0,1,0,1],但是,我也希望执行不止
一种
类型
的
聚合。
有效
语法示例 df.
groupby
('id').
agg
({'x1':sum, 'x2':sum, &
浏览 0
提问于2020-01-05
得票数 2
2
回答
获取
agg
函数
中
的
分组级别
、
、
我正在寻找
一种
简单可靠
的
方法
来获得熊猫群对象
的
agg
函数
中
的
分组级别。因此,例如,对于以下组对象
和
agg
命令:df = pd.DataFrame({'Name': ['foo', 'bar'] * 3,'Rank': range(6)}) grouped = df.
groupby
浏览 3
提问于2013-11-25
得票数 1
回答已采纳
1
回答
Pandas
应用聚合差异
、
我对
pandas
聚合
和
应用
的
区别感到困惑。据我所知,我不认为这个问题是其他问题
的
答案。data.
groupby
('source').apply(lambda x: len(x['test'][data['test']==0])) data.
groupby
('source').apply(l
浏览 1
提问于2021-07-21
得票数 0
1
回答
如何使用
groupby
()函数对数据进行切片?
、
、
、
在我
的
数据集中,我有25个类(数据集中
的
字母表),每个类有20个主题(我得到字母表
的
次数)。使用函数
groupby
(),它们(25*20 = 500)都具有相同
的
大小(1000)。我
的
数据集如下所示: ? 这就是我所尝试
的
,但它不起作用。它给出了一个'SeriesGroupBy‘对象没有属性'iloc’错误。for i in np.arange(211, 890, 20): new_dataset = new_dataset.
gr
浏览 79
提问于2021-01-30
得票数 0
3
回答
使用
pandas
GroupBy
.
agg
()对同一列进行多个聚合
、
、
、
、
pandas
有没有
一种
内置
的
方法
,可以在同一列df["returns"]上应用两个不同
的
聚合函数f1, f2,而不必多次调用
agg
()?"returns" : 0.05 * np.random.randn(10), }) # Assume `f1` and `f2` are
浏览 0
提问于2012-09-26
得票数 190
回答已采纳
1
回答
熊猫群:如何计算占总数
的
百分比?
、
如何计算在
groupby
中
显示总数%
的
列import numpy as npdf= pd.DataFrame(np.random.randint(5,8,(10,4)), columns=['a','b','c','d']) g = df.
groupby</
浏览 2
提问于2017-10-12
得票数 2
回答已采纳
3
回答
如何确保由
Pandas
为count创建
的
列有一个名称?
、
这肯定是一个基本
的
问题,但很难发现。假设我使用了
Pandas
groupby
和
agg
方法
来按某一列进行计数:那么,假设我想根据结果计数进行排序: df.
groupby
(['col1']).
agg
(['count']).sort_values('count&
浏览 0
提问于2018-04-20
得票数 0
2
回答
获得重复值
的
第一次
和
最后一次发生
、
我有一个像这样
的
dataframe 0 11/20 11/26 abc 35 2 11/22 11/27 abc 20df = df.
groupby
(['col3'])[['col4
浏览 2
提问于2021-11-24
得票数 0
回答已采纳
0
回答
Pandas
agg
函数,具有对多列
的
操作
、
、
、
如果我们可以使用
pandas
.core.
groupby
.DataFrameGroupBy.
agg
函数对多列进行算术运算,我很感兴趣。[0, 0, 2, 2, 5]print(df.
groupby
('C').
agg
({0: 'mean', 1: 'sum
浏览 3
提问于2017-12-09
得票数 0
1
回答
按小时对齐两个时间序列数据集(Python、
Pandas
)
、
、
一种
是测量
的
气象值,大约每15分钟测量一次,但不是在每小时
的
一致时间(即12:03、1:05、2:01等)。另一个数据集是精确地在小时上对位置
的
数据建模
的
。有没有人知道
一种
简单
的
方法
来对齐这些数据而不遍历所有的数据? File "C:\Python33\lib\site-packages\
pandas
\core\
groupby
.py", lin
浏览 2
提问于2013-11-05
得票数 2
1
回答
当某些列由“描述”聚合,而另一些列由其他聚合器聚合时,我如何定义
pandas
.
groupby
聚合函数?
、
、
我试图总结来自批处理生产过程
的
各种传感器
的
数据,以便使用
pandas
.
groupby
().
agg
({})函数将其与最终产品相匹配。问题是,如果在同一个字典中提供的话,熊猫似乎无法在同一个分组操作
中
执行这两种操作。('Batch').
agg
({'Sensor_1': ['mean', 'min'], 'Sensor_2': &
浏览 0
提问于2019-05-21
得票数 0
1
回答
Pandas
`
agg
` to list,"AttributeError / ValueError: Function not reduce“
、
、
、
通常,当我们使用
pandas
执行
groupby
操作时,我们可能希望跨多个系列应用多个函数。 似乎是执行这些分组
和
计算
的
自然
方法
。但是,在
groupby
.
agg
和
groupby
.apply
的
实现方式之间似乎存在差异,因为我不能使用
agg
对列表进行分组。元组
和
集合可以很好地工作,这表明你只能通过
agg
聚合到不可变
的
类型。通过
groupby</
浏览 29
提问于2018-02-22
得票数 2
回答已采纳
1
回答
用错误条绘制大熊猫数据格式
、
、
、
我正在准备一个熊猫数据,用于在R
的
ggplot2
中
绘制错误条,这需要计算列
的
统计数据。错误条要求最小值(平均标准开发)
和
最大值(平均+标准开发)。我得到这些使用
groupby
/
agg
:import numpy as np
浏览 5
提问于2015-02-09
得票数 1
回答已采纳
2
回答
如何在python
中
获取基于两个类别的列
的
最后一个值?
、
、
、
我想从值列中提取每个date
和
shift
的
最后一个值。例如,对于每一天,有两行,一行包含每个班次
的
日期时间、班次(白天或晚上)
和
最后一个数据点from value。在本例
中
,我想提取第3行(因为7/14
和
Day time
的
最高值为3) ? 我只知道如何获得每一列
的
最大值。我尝试了几种
方法
来完成这项工作,但对我来说都不起作用。我是python
的
新手,正在寻求您
的
帮助。
浏览 15
提问于2020-07-27
得票数 0
回答已采纳
1
回答
连接具有相同id
的
pandas
DataFrame行
、
、
假设我有一个熊猫DataFrame,如下所示:0 1 1 02 3 2 1假设我想组合具有相同id
的
行,以便行
中
的
其他元素放在一个列表
中
这样上面的dataframe将变成:0 [1, 2] [1, 1] 0与前两行相同,最后两行具有相同
的
id熊猫有这样
的
功能吗?我知道
pandas
浏览 0
提问于2016-01-14
得票数 11
回答已采纳
1
回答
DataFrameGroupBy
中
的
操作
、
、
、
我试图了解如何在“
groupby
”或数据帧
中
的
每个组
中
应用函数。import
pandas
as pddf = pd.DataFrame({'Stock' : ['apple', 'ford', 'google', 'samsung(['Sector'],as_index=False)
pandas
.core.
浏览 2
提问于2014-08-08
得票数 0
回答已采纳
1
回答
熊猫加工
的
多种模式
、
、
、
我显然是在处理稍微复杂
和
现实
的
数据,但是为了展示我
的
麻烦,让我们假设我们有这些数据:import numpy as np
agg
_mode = purchases_df.
groupby
(['date', 'user_id'])['purchase'].
agg
(pd.Series.mode)
agg</e
浏览 9
提问于2022-03-30
得票数 0
回答已采纳
点击加载更多
热门
标签
更多标签
云服务器
ICP备案
实时音视频
即时通信 IM
对象存储
活动推荐
运营活动
广告
关闭
领券