腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
MongoDB
聚合
管道vs
Pandas
聚合
、
我们目前使用了大量的MongoDB
聚合
管道来做一些数据处理。然而,我们经常遇到一些性能问题。我正在考虑将数据从MongoDB读取到
Pandas
数据帧中,并使用
Pandas
数据帧
聚合
来处理数据。另外,MongoDB
聚合
管道是否利用了内部的某种并行性?
浏览 0
提问于2020-05-15
得票数 2
2
回答
在Python
Pandas
中,如何使用like R dplyr mutate_each
、
、
、
在Python
Pandas
中,我想通过对多个列执行多个
聚合
函数来添加列,比如R mutate_each。例如,Python
Pandas
能否实现与以下R脚本相同的处理?%>% mutate_each(funs(min, max, mean), starts_with("Sepal")) iris %>%
浏览 3
提问于2017-10-18
得票数 5
2
回答
熊猫无法使用
聚合
函数列表进行
聚合
。
、
、
如何指定自定义
聚合
函数,使其在
pandas
.DataFrame.aggregate的列表参数中使用时行为正确import
pandas
as pddef ok_mean(x):df.aggregate(
浏览 4
提问于2019-02-26
得票数 4
1
回答
Pandas
聚合
、
我是
Pandas
的新手,并且已经在一个课程中使用过它,但是我肯定不精通Panda-ese。
浏览 2
提问于2017-01-17
得票数 0
4
回答
Pandas
if/then
聚合
、
、
、
我正在尝试弄清楚如何用python编写一条if/then语句,并对该if/then语句执行
聚合
。我的最终目标是,如果日期= 1/7/2017,则使用"fake“列中的值。这是我到目前为止所知道的: import
pandas
as pdimport datetime dte=pd.date_range
浏览 48
提问于2017-08-15
得票数 3
回答已采纳
1
回答
展平并重命名多索引agg列
我有一些
Pandas
/ 代码,它们使用两个
聚合
方法
聚合
特定的列,然后将多索引列重命名为扁平列。some_metric", "sum") : "some_metric_sum", ("some_metric", "max") : "some_metric_max"})这在cudf中工作得很好,但在
Pandas
有没有使用
Pandas
的类似方法?我喜欢cudf tuple语法,以及它们
浏览 21
提问于2020-05-12
得票数 2
回答已采纳
1
回答
熊猫滚动窗口意味着未来
、
、
我想使用
pandas
滚动功能 谢谢!
浏览 4
提问于2018-07-24
得票数 4
回答已采纳
2
回答
Pandas
滚动:
聚合
布尔值
、
、
在
pandas
.DataFrame中有没有滚动的" any“函数?或者,是否有其他方法可以在滚动函数中
聚合
布尔值?考虑一下: import
pandas
as pd s = pd.Series([True, True, False, True, False, False, FalseAttributeError: 'Rolling' object has no attribute 'any' 那么,在
聚合
布尔值时,我可以使用哪些函数呢
浏览 23
提问于2020-03-24
得票数 1
回答已采纳
1
回答
使用条形图显示数据数据火花潘达
、
、
、
我有以下数据格式df。 |-- id: long (nullable = false) |-- Marks: long (nullable = true)我想用列的主题,标记和年份来绘制一个条形图。对于每一个科目,我想看看每个科目的分数是如何评分的。我无法弄清楚如何使用三列或更多列绘制条形图。我尝试使用下面的代码来映射所有三列。这样做对吗? barchartPan
浏览 2
提问于2021-08-31
得票数 1
回答已采纳
1
回答
是否将行中的值追加到新列中?
我在CSV中有以下数据:Alexander,Frank,Johnson,460700,1 Ashley,Jane,Smith,470000,.25 Steve,Robert,Brown,460001,1first, middle, last, id, fte1, fte2, fte3,
浏览 0
提问于2018-09-14
得票数 0
1
回答
根据列中的值,有条件地
聚合
具有不同函数的分组数据框
、
考虑下面的
Pandas
数据帧。import
pandas
as pd "group_id,方法是对group_id进行分组,然后对每个组应用不同的
聚合
函数。中做这种
聚合
的好方法。或者,
Pandas
惯用的方式是只在分组数据结构上循环? 非常感谢您能提供的任何帮助!
浏览 21
提问于2021-01-24
得票数 1
回答已采纳
1
回答
如何在dask中编写unstack和reindex?
、
、
、
我用
pandas
编写脚本,但为了提高效率,我需要切换到dask,但我不确定如何在dask中实现unstack和reindex?这是我的
pandas
脚本的样子: df_new = df.groupby(['Cars', 'Date'])['Durations'].mean().unstack(fill_value=0).reindex
浏览 11
提问于2020-06-18
得票数 0
回答已采纳
2
回答
不带
聚合
或计数的Pyspark groupBy DataFrame
、
、
它可以在没有
聚合
或计数的情况下遍历Pyspark groupBy数据帧吗?例如
Pandas
中的代码: for i, d in df2:Is there a difference in how
浏览 54
提问于2020-01-07
得票数 3
回答已采纳
1
回答
熊猫NamedAgg错误:模块“熊猫”没有属性“NamedAgg”
、
、
我试图使用熊猫NamedAgg功能,并与它撞墙。我得到了“模块‘熊猫’没有属性'NamedAgg'”错误信息。
浏览 5
提问于2019-10-07
得票数 1
回答已采纳
1
回答
如何在
聚合
后将
pandas
数据帧转换为单索引?
、
、
我一直在玩
pandas
数据帧中的
聚合
。我使用以下方法进行
聚合
: agg_dict = {'a':{'a':'mean'},'c':{'c':'min'}} aggregated_df = df.groupby("batch").agg(agg_dict) 问题是,我希望最终的数据帧具有与原始数据帧相同的列,只是在每一列中显示
聚合
值的细微差别。上面
聚合
的结果是一个多索引
浏览 21
提问于2020-09-05
得票数 0
回答已采纳
2
回答
如何从包含分类列的数据框中绘制堆叠图
、
、
我有一个DataFrame:244 PAIDOFF 1000246 PAIDOFF 1000248 PAIDOFF 1000250 PAIDOFF 800253 PAIDOFF 1000 254 PAIDOFF
浏览 21
提问于2019-10-31
得票数 0
1
回答
Pandas
GroupBy
聚合
不保留数据类型
我通过使用sum、max和min等函数将
Pandas
GroupBy和Groupby.agg用于我的数值列,但我注意到以前强加给我的列的数据类型(如np.int8、np.int16、np.int32)在GroupBy
聚合
后不会保留,实际上每一列都被覆盖为int64。
Pandas
版本1.1.5 我目前的解决方案是在完成groupby
聚合
后重新转换,这是一个已知的问题和/或有更好的解决方案吗?
浏览 19
提问于2021-03-16
得票数 1
回答已采纳
1
回答
Python中
聚合
数据的描述性统计
、
我有一个已经
聚合
的数值数据集,即它包含对:原始值、计数(原始数据集中给定值出现的次数)。data = [1, 1, 1, 1, 1, 2, 2, 2, 4]min 1.00000050% 1.000000 75% 2.
浏览 1
提问于2019-09-18
得票数 0
回答已采纳
2
回答
带有groupby的pyspark collect_set或collect_list
、
、
、
、
在groupby之后,如何在数据帧上使用collect_set或collect_list。例如:df.groupby('key').collect_set('values')。我得到一个错误:AttributeError: 'GroupedData' object has no attribute 'collect_set'
浏览 2
提问于2016-06-02
得票数 62
回答已采纳
1
回答
Pandas
Dataframe (内部)在同一Dataframe上加入
、
、
、
、
我正在研究如何对patstat (参考数据库)数据库进行集群。 使用我自己的算法,我想出了一个数据框架,它显示了参考文献的作者、开始页、结束页、卷和publication_year。 运行: dfhead = df.head(10) 向我展示 ? 现在我想要:使用相同的数据帧显示内部连接,例如,author,beginpage和endpage是相同的。(行之间至少有3个相似之处) 我试过了: c = ['author', 'beginpage','endpage', 'volume','publication y
浏览 12
提问于2020-12-07
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
Pandas分组与聚合(一)
Pandas 2.0正式版发布:Pandas 1.5,Polars,Pandas 2.0 速度对比测试
python-pandas学习(三)Pandas缺失值处理
Python:Pandas
pandas入门指南
热门
标签
更多标签
云服务器
ICP备案
实时音视频
即时通信 IM
对象存储
活动推荐
运营活动
广告
关闭
领券