腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
5
回答
pandas
groupby
(),
使用
自定义
聚合
函数
连接
列
,
然后
使用
pandas
连接
行
、
、
am xyz 2 I do job
使用
pandas
应用
groupby
()后,预期结果为: Column1 Column22 I am Xyz Ido job 3 On weekend holidays I do nothing 所需的
聚合
首先适用于
列<
浏览 71
提问于2020-06-16
得票数 3
回答已采纳
1
回答
Pandas
Dataframe (内部)在同一Dataframe上加入
、
、
、
、
现在我想要:
使用
相同的数据帧显示内部
连接
,例如,author,beginpage和endpage是相同的。(dfhead, how = 'inner',on = [c[0],c[1],c[2]]) 哪里
然后
会给出答案,这样就只存在一个与同一
行
完全相同的内部
连接
,但我不希望它们包含在内。在上面的示例中,df_merge不应该接受任何值,因为没有3个相似的
列
。],'volume':[300,300]}) 请注意,这两
行
有(至少)3个
浏览 12
提问于2020-12-07
得票数 0
1
回答
python group by,传入列以
聚合
函数
参数
、
、
、
、
当我将几个列传递给
聚合
函数
时,我希望了解如何在
pandas
中进行
聚合
。我习惯了在R中
使用
dplyr,这是非常简单的。grouped_data.
浏览 81
提问于2018-06-17
得票数 2
回答已采纳
1
回答
Pandas
GroupBy
聚合
不保留数据类型
我通过
使用
sum、max和min等
函数
将
Pandas
GroupBy
和
Groupby
.agg用于我的数值
列
,但我注意到以前强加给我的
列
的数据类型(如np.int8、np.int16、np.int32)在
GroupBy
聚合
后不会保留,实际上每一
列
都被覆盖为int64。
Pandas
版本1.1.5 我目前的解决方案是在完成
groupby
聚合
后重新转换,这是一个已知的问题
浏览 19
提问于2021-03-16
得票数 1
回答已采纳
2
回答
聚合
是作为ETL的一部分还是在数据库中?
、
、
当涉及到是否应该将数据
聚合
到ETL worker的内存中(例如,
使用
pandas
groupby
或pd.pivot_table ),而不是在数据库级别执行
groupby
查询时,是否有一般的首选或最佳实践在可视化层,我
连接
到过去30天的详细交互级别数据,
然后
连接
到过去几年的
聚合
数据(每日级别)。 我认为,如果我计划实现
聚合
表,最好是在ETL阶段完成,因为这可以远程完成,而不会浪费数据库服务器的资源。
浏览 0
提问于2017-05-26
得票数 0
1
回答
在有重叠的熊猫中创建一个定制群
、
、
我正在
聚合
包含数据的数据,
使用
pd.Grouper对数据进行均匀采样,对数据进行分组,
然后
应用
函数
。在内部,一旦按时间定义了一个组(假设组为1秒),则连续组将在随后的秒开始,没有重叠。|grouped = df.
groupby
([pd.Grouper(level=df.time, freq=但是,我不能指定需要10
行</
浏览 7
提问于2022-09-23
得票数 0
4
回答
我如何
使用
pandas
agg对布尔值进行求和,并始终得到结果?
、
、
我有一个包含bool类型
列
的数据框。我想
使用
pandas
的
groupby
和agg
函数
来获取每个id的True值的数量。我已经做过很多次了,但是结果
列
的类型似乎取决于数据框。(data=d) 我从这段代码中得到的输出是:0 1 Truedf = pd.DataFrame(d
浏览 0
提问于2020-04-03
得票数 1
1
回答
使用
转换的熊猫分组列表
聚合
失败,关键错误
、
、
、
如何将list
函数
应用于不
使用
apply而是
使用
transform
聚合
的分组
pandas
dataframeimport
pandas
as pd df = pd.DataFrame({'key':[
浏览 4
提问于2020-11-24
得票数 3
回答已采纳
2
回答
在Python
Pandas
中,如何
使用
like R dplyr mutate_each
、
、
、
在Python
Pandas
中,我想通过对多个
列
执行多个
聚合
函数
来添加
列
,比如R mutate_each。例如,Python
Pandas
能否实现与以下R脚本相同的处理?iris %>% mutate_each(funs(min, max, mean), starts_with("Sepal")) 然而,我能够实现与
使用
Pandas
的变异体相同的处理。如下面的代码所
浏览 3
提问于2017-10-18
得票数 5
1
回答
将PySpark
groupby
collect_set迁移到Dask
、
、
我正在将一个pySpark实现迁移到
Pandas
。为了转换大型数据集,我
使用
了dask包。pySpark实现: df.
groupBy
('Key').agg(collect_set('ColumnA').alias('Items'), collect_set('ColumnB').alias('DocumentId')) 到
Pandas
df.
groupby
("Key")[['C
浏览 31
提问于2021-08-16
得票数 0
1
回答
Pandas
中的链式加权平均计算
、
我是
Pandas
的新手,我想将以下简单的R代码转换为
Pandas
,以便计算
列
的平均值和加权平均值(实际上,有更多的
列
需要
聚合
)。解决方案必须是可链接的,因为在此计算之前和之后都有多个步骤。我看过
使用
apply
函数
()的解决方案,但似乎要么必须在apply
函数
内执行完整的
聚合
步骤(对所有
列
,可能是不相关的
列
),我认为这很丑陋,要么分别计算平均值和加权平均值,
然后
进行表
连接</
浏览 25
提问于2019-10-21
得票数 1
0
回答
如何
连接
Pandas
dataframe
列
、
如何在
Pandas
数据帧中
连接
不同数据类型的
列
,以便如果
列
number与
列
operator
连接
在一起,并且我执行了一个
groupby
('user').sum(),我就可以拥有适当的
聚合
:4 -432 - C6 567 + D #df.
groupby</e
浏览 1
提问于2016-07-01
得票数 2
回答已采纳
0
回答
在
pandas
DataFrame的多个
列
中应用
自定义
函数
、
2,1,4], [1,2,3], [4,3,3], [3,2,5], [2,2,4]]我想对每一
行
应用一个
自定义
函数
然后
我想按键
聚合
(例如,average)。最终结果如下所示:0 1 47.002 3 373.33我知道我可以通
浏览 4
提问于2018-07-14
得票数 0
4
回答
panda aggregate by functions
、
、
-最终输出将是: id movie value5 cane22 45 wind1 1 if x['movie'].str.startswith('cane'):y = x.
groupby
(['value']).sum() e
浏览 18
提问于2018-08-24
得票数 2
回答已采纳
1
回答
熊猫:将数组求和为具有多个组比
列
的
聚合
、
、
我正在
使用
Python3.5.1和
Pandas
0.18.0。>>> df.
groupby
(['A','B']).sum()
浏览 3
提问于2016-10-03
得票数 3
回答已采纳
0
回答
Dataframe中的
Pandas
中的
聚合
列
、
、
、
我
使用
groupby
()和reset_index()
函数
使用
来自
Pandas
Dataframe的数据创建具有
聚合
值的
列
: df1=data.
groupby
(["subscriptio
浏览 5
提问于2017-06-13
得票数 0
回答已采纳
1
回答
如何在dask中执行group-by聚集后保留分区
、
、
、
、
在我的应用程序中,我
使用
groupby
对dask数据帧执行
聚合
,并按某个id排序。import numpy as npdf.index.name = 'my_id' d
浏览 0
提问于2018-02-17
得票数 4
2
回答
熊猫:
使用
相同的
列
ID折叠
行
,并将多个
列
串联为1。
、
如果不对数据进行迭代,是否可以
使用
熊猫方法“折叠”?837 apples 15 134 pears 3index ID description1 134 134: apples
浏览 3
提问于2021-12-28
得票数 0
回答已采纳
2
回答
Python
Pandas
agg错误
、
、
我试图在
Pandas
中
使用
agg
函数
生成描述性统计数据。我在
使用
lambda
函数
的一
行
时遇到了麻烦。当我将它们作为单独的代码行运行时,它们可以工作,但当我将它们作为一
行
运行时,就会出现错误。第一
行
代码: avg_Nox=('NOX', 'mean')) 第二
行
具有lambda
函数</e
浏览 0
提问于2019-12-19
得票数 1
1
回答
展平并重命名多索引agg
列
我有一些
Pandas
/ 代码,它们
使用
两个
聚合
方法
聚合
特定的
列
,
然后
将多索引
列
重命名为扁平列。df = ( .
groupby
(["some_dimension"]) .reset_indexsome_metric", "
浏览 21
提问于2020-05-12
得票数 2
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
Pandas与SQL的数据操作语句对照
像写SQL一样用Pandas
Pandas分组与聚合(一)
Pandas 2.0 vs Polars:速度的全面对比
在Pandas中通过时间频率来汇总数据的三种常用方法
热门
标签
更多标签
云服务器
ICP备案
实时音视频
即时通信 IM
对象存储
活动推荐
运营活动
广告
关闭
领券