腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
3
回答
pandas
groupby
列
列出
并
保留
特定
值
python
、
python-3.x
、
pandas
、
group-by
、
pandas-groupby
teacher222 analyst111 driver 444 lawyer 我创建了一个新
列
,其中包含所有职业的列表: new_df['occupation_list'] = df['id'].map(df.
groupby
('id')['occupations'].agg(list)) 如何在occupation_list中仅包含teacher和student
值
浏览 41
提问于2021-02-11
得票数 1
回答已采纳
1
回答
Groupby
熊猫数据格式
保留
一些
列
的唯一
值
,并
列出
其他
列
python
、
pandas
我希望通过material_id对以下输出进行分组,
保留
material_description和MPN的唯一
值
,但
列出
plant_id。='@search.score'].
groupby
('material_id').agg({lambda return df_ref 此当前按material_id分组,并
列出
其他
列
下面的代码用于保持按material_id分组的唯一
值
,但现在我缺少了plant_i
浏览 7
提问于2022-09-21
得票数 0
回答已采纳
3
回答
如何在
Pandas
中groupedBy中不
保留
分组
列
python
、
pandas
、
dataframe
我有一个数据,在
pandas
中,我想按电子邮件分组,获取date的最大
值
,
并
保留
status
列
。但是status没有在
groupby
上使用。status
列
,但我不知道如何
保留
。df.
groupby
([email]).aggregate({'date': max})+-------------------------------+| test3
浏览 4
提问于2018-07-23
得票数 3
回答已采纳
3
回答
python,
pandas
:如何指定多
列
并
仅合并重复行的
特定
列
python
、
pandas
、
dataframe
可以通过执行以下操作连接多
列
重复行中的
特定
列
值
,但
groupby
中指定的
列
以外的所有
列
都将消失。
列
title, thumbnail, name, created_at存在。检索具有重复title和thumbnail的行,如下所示,
并
连接重复行的name
列
的
值
,同时
保留
第一行。我想为它创建一个新的专栏。 但是,如前所述,
groupby
中指定的
列
以
浏览 201
提问于2021-11-22
得票数 2
回答已采纳
11
回答
在pyspark dataframe中显示不同的
列
值
。
python
、
apache-spark
、
pyspark
、
apache-spark-sql
有了
Pandas
,您如何实现与
Pandas
df['col'].unique()相当的功能。不是SQL类型方式(寄存器模板然后是SQL查询不同的
值
)。另外,我不需要
groupby
,然后是countDistinct,而是想在该
列
中检查不同的
值
。
浏览 21
提问于2016-09-08
得票数 176
回答已采纳
1
回答
Dask中的基本
groupby
操作
python
、
pandas
、
dask
通常,我会将其加载到内存中
并
使用
Pandas
。我想按两
列
"A“和"B”分组,每当"C“
列
以一个
值
开头时,我想为那个
特定
的组重复该
列
中的
值
。在熊猫中,我会做以下事情:Dask中的等价物
浏览 7
提问于2016-08-12
得票数 3
3
回答
python大熊猫栏和平均数
python
、
pandas
、
mean
我有一个在"A“列位置和"B”
列
值
中的数据。位置在这个DataFrame中多次出现,现在我想添加第三
列
,在该
列
中存储"B“
列
的平均值,该
列
在"A”
列
中具有相同的位置
值
。-I知道.mean()可以用来获得平均值我可以在A
列
中
列出
所有唯一的
值
,
并
通过一个for循环来计算所有这些
值
的平均值。
浏览 12
提问于2022-07-20
得票数 0
回答已采纳
3
回答
Pandas
groupby
:在
pandas
groupby
groupby
中根据另一
列
的数据选择行后如何选择相邻的
列
数据?
python
、
pandas
、
dataframe
、
pandas-groupby
对于每个日期,都有针对持续时间的条目(每个日期1-20个),并
列出
每个持续时间的项目(100)。每个项目在相邻的
列
中都有几个关联的数据点,包括一个标识符。对于每个日期,我希望选择最大的持续时间。然后,我希望找到与给定输入
值
最接近的项。然后我想获得该项目的ID,以便能够在数据库中跟踪该项目的
值
。
groupby
函数非常适合创建日期/持续时间组:df = df.
groupby
('Date')['Duration'].max() #cr
浏览 17
提问于2019-02-22
得票数 2
回答已采纳
2
回答
我如何在这个带有熊猫的数据框中找到唯一的
值
?
database
、
dataframe
列出
了每个地点的邻域名称,以及地点类型(我去掉了其他所有内容)。 我需要找到一种方法来获取每个社区中独特的场地类型的总数。例如,如果有8家咖啡店和2家餐厅,返回
值
应该是2。如果有1家咖啡店,1家餐厅和1家自助洗衣店,返回
值
应该是3,依此类推。 有人知道怎么做吗? ?
浏览 19
提问于2020-09-08
得票数 0
回答已采纳
1
回答
如何对
Pandas
中的最后两行进行分组和删除
pandas
、
dataframe
在
pandas
数据框中,我想按一
列
( ID )分组,然后删除每个ID的最后两行。 我知道这段代码将为每个ID
保留
最后两行,但我希望删除最后两行,
并
保留
其余行。df.
groupby
('ID').nth(-2) 感谢你的帮助
浏览 45
提问于2021-04-06
得票数 0
回答已采纳
2
回答
Python
Pandas
groupby
删除
列
python
、
pandas
time_of_day"] = "default value" #Formed a new column named time of the day for timestamps 因此,我在项目开始时创建了这些
列
,用于绘图和我编辑的数据分组,
并
使用某些
值
填充这些
列
,我想在data_c上执行manipulaton.After操作。avg_d = data_c.
groupby
(by = 'distance').sum().reset_index()
浏览 22
提问于2019-03-20
得票数 0
回答已采纳
1
回答
Pandas
GroupBy
聚合不
保留
数据类型
pandas
我通过使用sum、max和min等函数将
Pandas
GroupBy
和
Groupby
.agg用于我的数值
列
,但我注意到以前强加给我的
列
的数据类型(如np.int8、np.int16、np.int32)在
GroupBy
聚合后不会
保留
,实际上每一
列
都被覆盖为int64。
Pandas
版本1.1.5 我目前的解决方案是在完成
groupby
聚合后重新转换,这是一个已知的问题和/或有更好的解决方案吗?
浏览 19
提问于2021-03-16
得票数 1
回答已采纳
3
回答
防止在大型DataFrame、
Pandas
中使用group()和agg()语句的前导和尾随逗号
python
、
pandas
、
dataframe
我有一个很大的DataFrame,我需要根据其中一个ID
列
进行
groupby
(),并将其他所有内容放在一个csv列表中。我有一种方法可以很好地利用agg()方法。但是,我注意到,在单元格中有一个空(null)
值
的情况下,这种方法将
保留
带有前导或尾随逗号的空(null)。我需要防止这种情况发生。由于DataFrame的性质,用.lstrip(',')或.rstrip(',')一次替换每一
列
可能是不可能的。我还需要在源数据中
保留
空(null),所以我不
浏览 18
提问于2021-05-21
得票数 0
回答已采纳
2
回答
pandas
在执行
groupby
并
保留
选择性
列
后重置索引
python
、
pandas
我想要取一个
pandas
数据帧,按列计算唯一元素,
并
保留
其中的2
列
。但是我在
groupby
之后得到了一个多索引数据帧,我不能(1)展平(2)只选择相关
列
。下面是我的代码:df = pd.DataFrame({'Ticker':['AA','BB','CC','DD',&
浏览 1
提问于2018-09-14
得票数 4
回答已采纳
1
回答
熊猫群函数的一个
特定
值
的提取/细分
pandas
我有一个数据框架,在这个框架中,我希望使状态
列
中的
特定
值
可见,例如“已传递”和/或“确认”。orders.
groupby
(by=['status','size'])['id'].count() 我以前从来没有这样做过,所以我查阅了正式的
Pandas
文档,我怀疑这种方法是使用.get_grouporders.
groupby
(by=['status','size']).get_gro
浏览 3
提问于2022-05-29
得票数 1
回答已采纳
1
回答
Python
Pandas
-
Groupby
列
以获取
Pandas
dataframe
列
中的两个峰值
python
、
pandas
我使用Python
Pandas
对一个名为"Trace“的
列
进行分组。对于每个跟踪,都有一个包含两个峰值的"Value“
列
,我试图将它们传输到不同的数据帧中。第一个问题是,当我使用
groupby
时,它不会
保留
我想要选择的
值
所在行的其余数据。例如,如果一个
Pandas
数据帧有6
列
,那么我想在使用
groupby
之后
保留
所有6
列
。第二个问题是,我想要的两个最大
值
不是<
浏览 54
提问于2018-08-05
得票数 0
回答已采纳
2
回答
附加和处理重复
python-3.x
、
pandas
将附加的数据包含新
列
和重复
值
。因此,我通过在追加后删除重复的
值
来清理。有更好的办法吗? 目前,它运行得很好,但我害怕在大型DataFrames上重复搜索。
浏览 2
提问于2021-02-16
得票数 0
1
回答
如何根据
groupby
对dataframe中的行
值
进行求和?
python
、
pandas
我有一个使用案例,我得到了更大的csv文件,需要在三
列
标签上执行
groupby
,并且需要对
特定
列
的匹配行
值
求和,如果它是一个整数,如果它是一个应该替换为“NA”的字符串,我尝试使用
pandas
来继续,Import
pandas
as pddata = df.
groupby
([‘X’,’Y’,’Z’])[‘ADJ’].sum() print
浏览 44
提问于2020-04-29
得票数 0
回答已采纳
1
回答
如何创建新的
pandas
列
,该
列
是索引范围中不包括行
值
的每个
值
的列表
python
、
pandas
、
list
、
dataframe
、
indexing
我想知道是否可以在
pandas
dataframe中创建一个新
列
,它是每个
值
的列表,不包括行本身的
值
。例如,在下面的df中,对于
列
'list‘中的第一行,
值
b,c,以及行本身的
值
'a’。我已经尝试过了,但它返回了每个索引组合的所有
值
的列表:d = {'index': [1, 1, 1, 2, 2, 3], 'col1': [
浏览 13
提问于2020-05-29
得票数 0
回答已采纳
1
回答
读取
特定
列
,
并
使用csv或
pandas
模块获取其他
列
pandas
、
csv
我正在尝试解析一个csv文件,
并
使用
pandas
从
特定
的
列
中提取数据。| City | EFGH | Address2 | City5 |for
浏览 15
提问于2021-07-07
得票数 1
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
Pandas与SQL的数据操作语句对照
Pandas 2.0 vs Polars:速度的全面对比
Python数据分析之pandas(六)
在Pandas中通过时间频率来汇总数据的三种常用方法
Python之数据聚合与分组运算
热门
标签
更多标签
活动推荐
运营活动
广告
关闭
领券