腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(1022)
视频
沙龙
2
回答
如
何在
Python
语
言中
按
两
列
分组
:
计算
加权平均值
,
返回
DataFrame
python
、
pandas
、
numpy
、
dataframe
目标:获取一个
DataFrame
,
按
该
DataFrame
两
列
分组
,
计算
第三
列
的
加权平均值
,然后
返回
一个
DataFrame
。在下面的Reprex中需要进行哪些调整?## REPREXimport numpy as np md = {"group1": ["A&quo
浏览 98
提问于2020-10-14
得票数 2
回答已采纳
0
回答
groupBy在Spark中的应用
python
、
apache-spark
、
pyspark
、
apache-spark-sql
、
spark-dataframe
我目前正在学习
python
中的spark。我有一个小问题,在SQL这样的其他语
言中
,我们可以简单地
按
指定的
列
对表进行
分组
,然后对它们执行进一步的操作,
如
sum、count等。我们如
何在
Spark中做到这一点?"20"] [name:"DEF", city:"Lond
浏览 3
提问于2016-07-14
得票数 2
1
回答
熊猫群
按
加权平均
python
、
pandas
、
numpy
我有一个
DataFrame
,我想
按
日期
分组
(df
列
中的"count_date"),并对
按
计数("count")加权的平均速度("average_speed")应用
加权平均值
。df_merged.groupby("count_date").apply(lambda x: np.average(x['average_speed'], weights=x['count']))
浏览 5
提问于2022-08-16
得票数 0
回答已采纳
2
回答
在pandas中使用自定义函数和多个
列
进行聚合
pandas-groupby
、
transform
、
aggregation
、
summarization
假设我有以下数据帧:a 3 20b 5 10b 2 25 group new_value1 a 10.6 2 b
浏览 27
提问于2020-07-31
得票数 0
2
回答
使用Pandas
计算
组中计数的情况
python
、
python-3.x
、
pandas
、
group-by
、
case
我是使用
python
的初学者,我试图在一个代码行中
计算
开放率比率(
两
个不同计数之间的比率)。我的数据是这样的: (142, 1, 'open' , 'Mobile'),], columns=['sent_mail_id', &
浏览 2
提问于2021-05-11
得票数 2
回答已采纳
1
回答
熊猫的群序与投影
python
、
pandas
我在Pandas中有一个数据框架,在该数据框架中,我想知道
两
个特定
列
中每个值组合发生的次数。但是,如果我首先执行一个投影,然后
按
组,则
返回
一个空结果:如果删除计数,我将得到一些结果,但它们似乎没有
分组<
浏览 0
提问于2015-08-13
得票数 1
回答已采纳
1
回答
Python
Pandas groupby应用lambda参数
python
、
pandas
、
lambda
、
pandas-groupby
在一段关于
Python
Pandas groupby的coursera视频中(在
Python
中的数据科学入门课程中),给出了以下示例:其中df是一个
DataFrame
,而lambda用于
计算
两
列
的总和。如果我理解正确的话,调用apply函数的groupby对象(由groupby
返回
)是一系列元组,由
分组</em
浏览 3
提问于2017-11-29
得票数 12
回答已采纳
1
回答
dask groupby agg加权平均“未知聚合lambda”错误
python
、
dask
在Dask中,我需要基于第三
列
从
两
列
的
分组
值
计算
加权平均值
。/site-packages/dask/
dataframe
/groupby.py", line 1555, in agg File "/anaconda3/lib/
浏览 35
提问于2019-08-27
得票数 2
4
回答
在pandas中过滤GroupBy之后的组,同时保留这些组
python
、
pandas
、
pandas-groupby
在pandas中,我想要做的是:df.groupby('A').filter(lambda x: x.name > 0) - group by
列
A,然后过滤名称为non positive的组。但是,当GroupBy.filter
返回
DataFrame
时,这会取消
分组
,从而丢失
分组
。我想
按
这个顺序来做,因为它应该对
计算
要求较低,因为filter后面跟着groupby会遍历
DataFrame
两
次,不是吗(首先过滤
浏览 3
提问于2018-04-14
得票数 12
3
回答
熊猫-如
何在
有条件的群中创建多个
列
?
python
、
pandas
、
dataframe
、
pandas-groupby
我需要
分组
一个
dataframe
,但是我需要创建
两
个
列
,一个是简单计数,另一个是带有条件的计数,
如
示例所示:qtd_ok
列
只
计算
那些有“OK”的我尝试过这样做,但是我不知道如
何在
同一个
浏览 0
提问于2018-11-21
得票数 4
回答已采纳
1
回答
将数据切割成
两
列
,并
计算
每一段第三
列
的平均值。
pandas
、
dataframe
、
pandas-groupby
、
cut
目标:取一个
DataFrame
,
按
该
dataframe
的
两
列
分组
,
计算
其他
列
的平均值,并
返回
一个数据。我该怎么办?, 5], "var1":[343, 345, 567, 569],df = pd.
DataFrame
浏览 7
提问于2022-03-14
得票数 0
1
回答
熊猫组分类并将副本索引应用于附加
列
python
、
pandas
考虑下面的MWE和最后三行选择:(df.assign(mybins = lambda df: pd.cut(df[我想
按
'a‘
列
的垃圾箱
分组
,做一些
计算
。当我使用.sum函数时,它
按
预期工作,它
返回
回收箱作为索引,每个bin的和作为
列
值。现在,当我使用apply函数
计算
和时,groupby索引在
datafram
浏览 1
提问于2016-06-27
得票数 1
回答已采纳
2
回答
Pyspark:
按
布尔
列
对连续行进行
分组
apache-spark
、
pyspark
、
apache-spark-sql
我在
Python
语
言中
有一个Spark
dataframe
,它按照特定的顺序,可以根据值为1或0的
列
"start_of_section“将行划分到正确的组中。对于需要组合在一起的每个行集合,除了"value“和"start_of_section”之外的每一
列
都是相等的。我希望将每个这样的集合
分组
到一行和一个
列
"list_values“中,前者每隔一
列
具有相同的值,后者包含每行中所有值的数组。在新的数据帧中,这将是
浏览 2
提问于2020-08-24
得票数 1
1
回答
如何仅在满足特定条件/
计算
的情况下使用pandas/
Python
对数据进行
分组
和聚合?
python
、
pandas
、
pandas-groupby
有一个看起来像这样的pandas.
DataFrame
df:Berlin USA 43.9727912 -88.9858084 5524但为了处理歧义-美国的
两
个条目不会合并,我的想法是
计算</
浏览 1
提问于2020-12-18
得票数 2
1
回答
Pandas为
列
创建自定义groupby聚合
python
、
pandas
在Pandas中,有没有一种方法可以创建一个新的
列
,它是
两
列
聚合的函数,这样对于任何任意的
分组
,它都会保留该函数?这在功能上类似于在excel中创建
计算
列
并按标签旋转。df1 = pd.
DataFrame
({'lab':['lab1','lab2']*5,'A':[1,2]*5,'B':[4,5]*5}) df1['C'] = df1.apply(la
浏览 0
提问于2018-04-10
得票数 1
2
回答
熊猫数据组不移除
分组
密钥
python
、
pandas
、
group-by
、
pandas-groupby
根据这个例子,我首先创建一个数据框架:现在,让我们
按
标有"A“的
列
分组
,并根据其值将其他
两
列
相加:这样做是合理的,
按
"A“
分组
并产生: B
浏览 0
提问于2018-01-17
得票数 1
回答已采纳
5
回答
用Pandas计数和排序
python
、
sorting
、
pandas
、
count
、
group-by
我有一个值的
dataframe
,它是一个文件,根据该文件,我
按
两
列
分组
,这些
列
返回
聚合的计数。现在我想
按
最大计数值进行排序,但是我得到了以下错误: 查看
按
agg计数列的组是某种索引,所以不知道如何做,我是
Python
和Panda的初学者。
浏览 10
提问于2016-11-06
得票数 44
回答已采纳
2
回答
熊猫:有条件的
分组
计算
python
、
pandas
假设我有一个带有键的表(例如,customer )和
两
个数字
列
C1和C2。我希望按键(customer)对行进行
分组
,并在其列上运行一些聚合器,
如
sum和mean。在
计算
组聚合器之后,我想将结果分配回
DataFrame
中的每个客户行(因为每个行都添加了一些客户范围的特性)。我能看到我能做一些像如果我只想聚合一个
浏览 5
提问于2014-06-16
得票数 5
回答已采纳
1
回答
带差和和组
python
、
pandas
,我创建了一个用于测试的数据文件:data = np.array([[1,2,2] , [1,5,4], [7,8,18]])df_1 A B C1 1 5 4要
计算
'C‘和'B’
列
之间的差异,我使用: df_2 = pd.<e
浏览 0
提问于2017-11-29
得票数 2
回答已采纳
1
回答
绘制
python
中的非数值数据
python
、
dataframe
、
matplotlib
假设这是数据,DeathYear、Age、Gender和Country都是excel文件中的
列
。 以及为什么使用组和键入列
两
次('Gender')['Gender']
浏览 3
提问于2020-06-23
得票数 1
点击加载更多
热门
标签
更多标签
云服务器
对象存储
ICP备案
云点播
腾讯会议
活动推荐
运营活动
广告
关闭
领券