腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
2
回答
仅
获取
Pandas
groupby
中
的
组
的
匹配
行
、
、
,'l','m','m','l','l'], df = pd.DataFrame(d) 当我对三个字段进行分组时,我得到了结果: gb = df.
groupby
如何才能
仅
提取
组
中
某一
行
与分组列上另一
组
中
至少另一
行
匹配
的
组
和<em
浏览 5
提问于2019-02-28
得票数 1
回答已采纳
1
回答
如何从熊猫
的
所有
行
中
删除
组
平均值/min/max
、
、
考虑到这些数据(但显然有更多
的
行
): 1 2.5 2 4.5MWE:df = pd.DataFrame({"group": [1, 1, 2, 2], "value": [2.5, 3.5, 4.5, 5.5]}) 我们怎么能轻松地去除
组
平均/min/max当从
行
中
移除
gr
浏览 3
提问于2020-04-15
得票数 0
1
回答
如何在一个熊猫数据框架中保持每一
组
的
顶部[2-31]
行
?
、
说,我可以使用df.
groupby
('id')['value'].nlargest(30)为每个
组
获取
top30
行
。但是,如何为每个
组
从top2获得
行
到top31?有没有类似于
pandas
.Series.nlargest这样
的
函数?
浏览 1
提问于2017-11-21
得票数 2
回答已采纳
1
回答
当
groupby
使用多个列时应用get_group()
、
我将
Pandas
groupby
应用于数据帧,以
获取
几个字段
的
所有可用组合,如下所示: list_of_fields = [field1, field2, field3, field4] grouped= df.
groupby
(list_of_fields) 这与预期
的
一样,当我在grouped.groups
中
打印分组时,我得到了正确
的
元组组合。现在,我需要使用grouped
中
的
组
来创建多个数据帧,
浏览 3
提问于2021-01-24
得票数 0
回答已采纳
3
回答
熊猫数据-选择相似的
行
、
、
是否有办法选择“相似”
的
行
(而不是重复
的
!)在熊猫
的
资料里?我想知道在不同
的
地区是否有类似的名称
的
学校。我所能想到
的
就是选择一个随机
的
学校名称,并手动检查dataframe
中
是否存在类似的名称,方法如下: df[df['school_name'].str.contains('e
浏览 3
提问于2020-08-12
得票数 0
1
回答
如果我有多个group by字段,如何从Dask DataFrameGroupBy
中
获取
所有
组
?
、
、
如何从分组数据框
中
获取
Dask
中
的
所有唯一
组
?假设我们有以下代码:我必须遍历所有
组
并处理
组
内
的
数据。我
的
想法是获得所有唯一
的
值组合,然后遍历集合并调用。对于他们
中
<
浏览 3
提问于2018-02-20
得票数 4
1
回答
创建包含平均值信息
的
新DataFrame
、
我有一个包含" action“、"Filt”和"Val“列
的
dataframe,这些列度量了过滤操作
的
结果错误。我要计算每个"Action“和"Filt”
的
平均误差。目前,我通过迭代"Action“和"Filt”
的
每一个组合来实现这一点。但是,恐怕切片所花费
的
时间比我想要
的
要多。import
pandas
as pd ("run", "ra
浏览 0
提问于2017-06-19
得票数 2
回答已采纳
1
回答
Dask/
Pandas
是否支持基于依赖于其他
行
的
复杂条件删除
组
中
的
行
?
、
、
、
我正在使用Dask处理一堆csv格式
的
基于文本
的
记录,我正在学习使用它来解决内存问题太大
的
问题,并且我正在尝试过滤最符合复杂条件
的
组
中
的
记录。在重要
的
情况下,复杂
的
标准围绕着剔除网页上基于整个
组
的
链接url、链接文本和css选择器
的
有前途
的
链接。考虑给定
的
A,和入围列表
中
的
B,以及C
的
新记录,
浏览 6
提问于2019-07-25
得票数 0
2
回答
使用具有特定值
的
GroupBy
过滤熊猫DataFrame
、
、
我想将
pandas
DataFrame过滤到特定
行
的
组
中
包含特定列值
的
最小计数
的
行
。例如,
仅
返回df
的
行
/
组
,其中'c2','c3‘
组
至少有2
行
'c1’值为1: df = pd.DataFrame({'c1':[0,1,0,1,1,0], 'c2':[0,0
浏览 0
提问于2019-07-02
得票数 4
1
回答
Pandas
Dataframe (内部)在同一Dataframe上加入
、
、
、
、
现在我想要:使用相同
的
数据帧显示内部连接,例如,author,beginpage和endpage是相同
的
。(dfhead, how = 'inner',on = [c[0],c[1],c[2]]) 哪里 然后会给出答案,这样就只存在一个与同一
行
完全相同
的
内部连接,但我不希望它们包含在内。在上面的示例
中
,df_merge不应该接受任何值,因为没有3个相似的列。],'volume':[300,300]}) 请注意,这两
行
有(至少)3个相似的列,因此合并
浏览 12
提问于2020-12-07
得票数 0
2
回答
获取
每个
组
的
特定索引数。
在这个示例
中
,dataframe:import numpy as np df = pd.DataFrame(np.random.randn(9, 4), index=i, 什么是最快
的
方法,以获得每只动物
的
第二排作为数据?
浏览 0
提问于2019-02-08
得票数 2
回答已采纳
2
回答
如何在数据框
中
查找其值为True
的
行
?
、
我有一个数据框,在这个数据框
中
a有两列(有时我有一列或更多列)。我尝试编写一个程序来查找它们
的
值为True
的
行
,并且我还想创建以下字典:我
的
第一个子列表以数字2开头,因为我
的
第一个值为True,当我再次找到一个值为True时,我会开始一个新
的
子列表。在这个字典
中
,我有键=0,也就是表(我有一个pdf表,我用camelot读取它)和值。 ?
pandas
_dict = {0:[[2,3,4,5],[6,7,8,9,10,11,12
浏览 117
提问于2021-06-29
得票数 0
回答已采纳
2
回答
根据列上
的
子字符串条件查找
组
中
的
下一
行
-
Pandas
、
我试图根据子字符串条件在
组
中
获取
下一
行
。 ['url'].apply(lambda x: x.str.contains("confirmation"))\如果当前
组
中
<e
浏览 0
提问于2020-09-10
得票数 1
回答已采纳
1
回答
Pandas
df grouby在不同
的
列上有一定
的
匹配
、
、
、
我想通过2个条件聚合一个
pandas
df列。 1)首先,我想按col1分
组
2)
仅
当col2有最少一
行
匹配
0和最少一
行
匹配
1时,我才需要col3
的
平均值。我尝试了一些这样
的
组合,但这当然不起作用: df.
groupby
(['col1'])['col2'].isin([0 & 1]).col3.mean() 例如,如果这是我
的
df: df = pd.D
浏览 10
提问于2019-02-09
得票数 2
回答已采纳
1
回答
排除潘达斯标准差
组
中
的
异常值?
、
、
我有一个
Pandas
的
数据,我试图从一个
组
的
基础上删除离群。
组
中
的
每一
行
都被视为孤立值,如果列超出了其中group_mean是
组
中
列
的
平均值,group_std_dev是
组
列
的
标准差。这个错误对我来说似乎没有多大意义,因为比较
浏览 4
提问于2020-01-22
得票数 1
回答已采纳
1
回答
在有重叠
的
熊猫
中
创建一个定制群
、
、
我正在聚合包含数据
的
数据,使用pd.Grouper对数据进行均匀采样,对数据进行分组,然后应用函数。在内部,一旦按时间定义了一个
组
(假设
组
为1秒),则连续
组
将在随后
的
秒开始,没有重叠。'1s', dropna=True) ]) 如果数据上
的
数据具有恒定
的
采样(0.1Hz),则结果将是一个<
pandas
.core.
groupby
.generic.SeriesGroupBy>类型
的
对象,其
浏览 7
提问于2022-09-23
得票数 0
2
回答
使用
Pandas
计算每组
的
最大值
、
64.0 14833 2 68.0 1806我想要找出每个
组
中有多少个最高分
浏览 0
提问于2021-03-31
得票数 1
4
回答
不清楚为什么使用单个
组
的
groupby
会产生
行
DataFrame
、
下面是对一个
groupby
的
两个
pandas
.DataFrame操作 ans1 = d.
groupby
(grp1).apply(lambdax: x.a * x.b.ilo
浏览 5
提问于2021-09-08
得票数 9
回答已采纳
1
回答
Pandas
索引提供KeyError:(片(无,无,无)
、
、
我正在用Python3
中
的
Pandas
索引和切片数据来计算空间统计数据。当我在纬度和经度范围上运行for循环时,使用.loc,为输入文件
中
没有可用值
的
特定纬度和经度集提供一个错误KeyError: (slice(None, None, None), )。以下是我
的
密码。2017 1 0.0 34.0 0.0363332020 1 0.0 34.0 0.109500 但是,对于输入文件
中
没有
浏览 6
提问于2022-07-09
得票数 0
2
回答
除在python中使用均值、中值外,计算丢失
的
值
、
、
我听说这意味着,中位数不是计算缺失值
的
最佳方法,为什么会这样呢?在我
的
场景
中
,我有这样
的
数据A|2,A|4,B|NaN,C|9,如果使用平均计算,数据将是A|2,A|4,B|7.3,C|9,这对品牌B来说是有意义
的
,但如果品牌A是7.3,那就没有意义了,因为品牌A
的
价值大约在2和8左右,还有其他方法来填补基于品牌
的</em
浏览 0
提问于2018-09-02
得票数 2
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
排序,分组,组内排序
Pandas与SQL的数据操作语句对照
盘点一个Pandas处理Excel表格实战问题(上篇)
Pandas 2.0 vs Polars:速度的全面对比
你可能不知道的10个Python Pandas的技巧和特性(下)
热门
标签
更多标签
云服务器
ICP备案
实时音视频
即时通信 IM
对象存储
活动推荐
运营活动
广告
关闭
领券