腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
使用
groupby
在
Pandas
DataFrame
上
进行
计算
,
然后
将其
传
递回
DataFrame
?
、
、
、
我有一个数据框,我想按两个变量分组,
然后
在这些变量中执行
计算
。有什么简单的方法可以做到这一点,并在我完成后将信息放回
DataFrame
中,即如下所示:'B':[1,1,1,2,3,3,3,2,3,4101,230,12,122,345,23,943,83,923,10]}) avg = []BID = [] for name, group
浏览 8
提问于2016-07-26
得票数 2
回答已采纳
1
回答
按列和连接结果
计算
大熊猫
DataFrame
组的最小最大值中值
、
、
我有一个熊猫
DataFrame
,我想在一个列上执行最小,最大,平均,中值的
计算
,用A,B和C列对它们
进行
分组,
然后
我想将结果合并到初始的
DataFrame
。当我
计算
中间值时,我成功地
使用
了低音:result_median
浏览 1
提问于2019-08-06
得票数 3
回答已采纳
2
回答
dask数据帧中的df.
groupby
(...).apply(...).reset_index()
、
、
、
我想
使用
两个Dask
DataFrame
来处理大型csv文件,并且我需要在一个
DataFrame
上
执行
groupby
(...).apply(...).reset_index(),
然后
才能
将其
加入到另一个
DataFrame
中: import
pandas
as pd dfA = pd.
DataFrame
({'x': [&qu
浏览 36
提问于2021-10-07
得票数 1
回答已采纳
1
回答
使用
Python: Group by和plot ratios
进行
比较,添加其他
计算
(例如:直方图、散点图、密度图)
、
、
、
、
有12种组合,每个销售人员
在
不同的时间坐着或站着。共有36个数据点。
在
图中,我想要显示站立/坐着的比率与比率目标相比有多远,
然后
添加工作分钟数(可能
使用
条)。我已经
在
Python中
使用
Groupby
(
Pandas
)
进行
了尝试,但我无法绘制其中的任何内容 在这一点
上
,我不确定我是否应该继续
使用
"
groupby
“。我不确定是否应该
使用
散点图、密
浏览 29
提问于2019-01-25
得票数 0
0
回答
使用
字典跨列
Pandas
Rank时出错
、
、
我曾经
使用
一段代码来
使用
字典对每个类别中的列
进行
排名。但是对于新的
Pandas
/Python3,我得到了以下错误:如有任何建议或帮助,我们将不胜感激。代码如下:import numpy as npd ={'A': 'Health Care', 'AA': 'Mat
浏览 1
提问于2018-07-14
得票数 0
1
回答
边上具有累积和的Networkx权重
、
、
1.创建dfimport networkx as nxa = ['A', 'B', 'C', 'A', 'A']df = pd.
DataFrame
(ints, columns=['weight']) df[&
浏览 0
提问于2017-01-06
得票数 1
回答已采纳
2
回答
如何在Python语言中按两列分组:
计算
加权平均值,返回
DataFrame
、
、
、
目标:获取一个
DataFrame
,按该
DataFrame
两列分组,
计算
第三列的加权平均值,
然后
返回一个
DataFrame
。在下面的Reprex中需要
进行
哪些调整?## REPREXimport numpy as np md = {"group1": ["A", "A", "1, 1, 1],
浏览 98
提问于2020-10-14
得票数 2
回答已采纳
1
回答
koalas
groupby
-> apply返回‘无法插入"key",已存在“”
、
、
、
我一直
在
努力解决这个问题,但一直无法解决,我得到了最新的数据框架: import databricks.koalas as ks {'ds如果我
使用
pandas
执行group-by应用,代码将按预期执行: import
pandas
as pda = pd.
DataFrame
.from_dict(x.to_dict()).
groupby
('store'
浏览 36
提问于2020-03-22
得票数 0
回答已采纳
1
回答
带有
DataFrame
的
Pandas
groupby
系列
、
我想按
DataFrame
对系列
进行
分组,
然后
执行缩减,如下例所示: columns=['name', 'sex', 'amount', 'id']) In [3]: df[
浏览 0
提问于2014-05-29
得票数 1
1
回答
如何在dask中编写unstack和reindex?
、
、
、
我用
pandas
编写脚本,但为了提高效率,我需要切换到dask,但我不确定如何在dask中实现unstack和reindex?这是我的
pandas
脚本的样子: df_new = df.
groupby
(['Cars', 'Date'])['Durations'].mean().unstack(fill_value=0).reindex
浏览 11
提问于2020-06-18
得票数 0
回答已采纳
2
回答
熊猫稀疏矩阵的群--先填充它们
、
、
2 'cat3' B4 'cat3' B
然后
,我对cat列
进行
虚拟,以便为机器学习分类做好准备df2 =
pandas
.get_dummies(df,columns=['cat'], sparse=True)df2.
groupby
(['id','team
浏览 6
提问于2015-05-16
得票数 1
回答已采纳
5
回答
如何根据
pandas
中的值对序列
进行
分组?
、
、
、
我目前有一个dtype为Timestamp的
pandas
Series,我想按date对它
进行
分组(并且
在
每个组中有许多不同时间的行)。一种看似显而易见的方法是类似于然而,熊猫的
groupby
根据它的指数
进行
了分组。我如何才能
将其
按值分组?
浏览 61
提问于2015-11-03
得票数 74
2
回答
在
使用
groupby
应用生成系列时保留
DataFrame
的索引
、
、
当
使用
groupby
+ apply调用函数时,我想从
DataFrame
转到Series
groupby
对象,将一个函数应用到每个以Series作为输入并返回Series作为输出的组,
然后
将
groupby
默认行为是将来自
groupby
+ apply的输出按分组字段
进行
索引,这使我无法
将其
清晰地分配给
DataFrame
。我更喜欢
使用
apply调用的函数,以一个Series作为输入,并返回一个Seri
浏览 2
提问于2017-02-11
得票数 4
回答已采纳
2
回答
.apply如何在
Pandas
DataFrame
.
groupby
上工作?
、
、
、
我想看看主场赢,平局,客场赢球的比例,
在
比赛中所占的比例。我看到了解决以下问题的办法:乍一看,这是有意义的,但是g到底是什么呢?我以为是H,D或A计数,
然后
g.sum()将所有的H,D,A计数按每个部门分组。但是,如果g只是一个值,我们如何调用方法g.sum()?g到底是什么?
浏览 2
提问于2020-05-29
得票数 2
回答已采纳
3
回答
避免
GroupBy
在
大型
Pandas
DataFrame
上
的内存问题
、
、
、
、
pd.read_sql(query, engine)从这个df创建一个dask如下所示:
使用
dask执行操作不会导致任何明显的进展(
使用
dask诊断检查): result = df.
groupby
('journal_entry').max().reset_index我试图
在
df
上
执
浏览 1
提问于2018-04-26
得票数 12
回答已采纳
1
回答
如何在spark中
使用
pandas
split-apply-combine风格策略和scala api?
、
、
、
它需要整个数据帧的内容来
进行
计算
,它不能一次添加一行并建立一个结果。
使用
PandasUDF这将是一个相对简单的任务,但是我不知道如何在Scala中做到这一点。我尝试
使用
group by列对数据帧
进行
重新分
浏览 28
提问于2020-04-22
得票数 0
1
回答
如何
使用
最近相邻年份的值填充
Pandas
面板的缺失值?
、
在下面的示例中,我想
使用
1994的值。SIC通常在所有年份都是相同的。
在
极少数情况下,它可能会随着时间的推移而变化。我有一个由25万个观察值组成的大小组。谢谢!
浏览 31
提问于2019-02-02
得票数 0
回答已采纳
1
回答
Python: Netcdf:有没有一种方法可以从一个变量中获得总平均值,而另一个变量与唯一的值重叠?
、
、
、
不需要0值,所以我想开始对p
进行
总体(空间时间)平均,其中标记值=1到最大标记值n。 示例(array space (time,lat,lon)):第一个整数标记值为1。dimensions: (u'time', u'lat', u'lon') type: dtype('int32') 我一直
在
尝试
pandas
的
groupby
函数,但我还没有找到适用于
浏览 6
提问于2020-04-01
得票数 0
2
回答
群熊猫数据与
计算
多列均值
、
、
、
我试图将熊猫的数据按列分组,
然后
计算
出多个列的平均值。在下面的示例中,我想按“类别”列
进行
分组,
然后
计算
“得分”和“优先级”列的平均值。所有三列都应位于生成的
dataframe
中。我能够对第一列
进行
分组并
计算
平均值,但我不知道如何添加第二列。
在
我的尝试之下。 data = [['A', 2, 1], ['A', 4,
浏览 3
提问于2022-05-24
得票数 1
回答已采纳
1
回答
如何过滤
Pandas
对象并获取
GroupBy
对象?
、
当对
Pandas
操作的结果执行筛选时,它返回一个数据。但是如果我想要做更多的组
计算
,我必须再次调用
groupby
,这似乎有点接近。有没有一种更地道的方法来做到这一点?编辑:我们无耻地从潘达斯的文档里偷了一个玩具数据,
然后
分组:>>> grouped =
浏览 7
提问于2016-03-06
得票数 13
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
热门
标签
更多标签
云服务器
ICP备案
云直播
对象存储
实时音视频
活动推荐
运营活动
广告
关闭
领券