腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
按
数据
帧
分组
然后
过滤
pandas
的
最
有效
方法
、
、
下午所有人,display(df_ccy [df_ccy ['state']=='Done'][['currency_str','state','count']]) 我是否应该像上面那样在原始
的
groupby语句或
过滤
器上使用Lambda函数?
浏览 16
提问于2018-03-01
得票数 1
回答已采纳
4
回答
在
pandas
中
过滤
GroupBy之后
的
组,同时保留这些组
、
、
在
pandas
中,我想要做
的
是:df.groupby('A').filter(lambda x: x.name > 0) - group by列A,
然后
过滤
名称为non positive
的
组。但是,当GroupBy.filter返回DataFrame时,这会取消
分组
,从而丢失
分组
。我想
按
这个顺序来做,因为它应该对计算要求较低,因为filter后面跟着groupby会遍历DataFrame两次,不是吗(首先
过滤
浏览 3
提问于2018-04-14
得票数 12
1
回答
pandas
奇特
的
索引和合并
、
在通过花哨
的
索引
过滤
后,将更改合并回
pandas
数据
帧
的
最
简单
方法
是什么?d[d.x % 2 == 0]['y'
浏览 0
提问于2013-01-13
得票数 4
1
回答
如何删除由python代码创建
的
所有
pandas
dataframe
、
、
我想删除我
的
python代码创建
的
所有
pandas
dataframe。我知道有一个选择 del df 要删除dataFrame df,请执行以下操作。但是我看起来有点像R命令 rm(list=ls()) 删除由我
的
代码创建
的
所有可用
数据
帧
。你能建议一下吗?
浏览 32
提问于2020-09-07
得票数 0
回答已采纳
1
回答
按
2列
分组
并取其他两列
的
点积后,将一列添加到原始熊猫
数据
框架中。
、
、
、
我有以下
的
熊猫
数据
框架:我想在原始
数据
帧
中添加Avg price列,
然后
按
(Date,Issuer)
分组
,
然后
取权重和价格
的
点积,这样就可以这样:是否有一种不使用合并或联接
的
方法
来完成此操作做这件事
最
简单
的
方法
是什么?
浏览 4
提问于2020-02-06
得票数 0
回答已采纳
1
回答
计算
Pandas
Dataframe中多列
的
日平均值,
然后
插入一行
、
、
、
、
我使用
Pandas
向
数据
帧
输入了一个CSV文件,并希望计算其中列
的
日平均值。有两个列不会被平均化,时间和日期(日期是
数据
分组
的
日期)。
然后
,我希望在该日期
的
最后一行下面插入一行,在date列中插入“Average”( time列中没有任何内容),
然后
在正确
的
列中插入相应
的
平均值。我只使用了
Pandas
一段时间,所以我不知道
最
简单
的</em
浏览 12
提问于2022-06-17
得票数 0
2
回答
如何在python中获取基于两个类别的列
的
最后一个值?
、
、
、
我有一个
数据
集,其中包含date、shift、value等列。我想从值列中提取每个date和shift
的
最后一个值。例如,对于每一天,有两行,一行包含每个班次
的
日期时间、班次(白天或晚上)和最后一个
数据
点from value。 在本例中,我想提取第3行(因为7/14和Day time
的
最高值为3) ? 我只知道如何获得每一列
的
最大值。我尝试了几种
方法
来完成这项工作,但对我来说都不起作用。我是python
的
新手,正在寻求您
的</e
浏览 15
提问于2020-07-27
得票数 0
回答已采纳
1
回答
如果重复,则在Python
Pandas
中返回相应
的
行值
、
、
、
我正在尝试对excel
的
一列进行排序,以显示重复
的
邮政编码。如果存在重复
的
邮政编码,我会尝试让
pandas
从重复
的
邮政编码中查找一列,对这些值求和,
然后
使用重复/求和
的
值创建一个新
的
列表。目前,我可以创建所有副本
的
列表,但我不知道下一步需要采取什么步骤。感谢任何帮助,因为我是编码新手。
浏览 27
提问于2019-11-09
得票数 0
回答已采纳
1
回答
对多个列表元素应用一组指令
我有一些代码可以从目录中读取所有的xlsx,将其作为列表导入到RStudio中,并用文件名命名列表中
的
每个元素。每个元素都存储为一个
数据
帧
。我刚接触R,但是在列表
的
每个元素上应用一组函数
最
合理
的
方法
是什么呢?每个
数据
帧
在布局上都是相同
的
。 我希望
过滤
到特定
的
区域,
按
年龄
分组
,
然后
将此信息提取为新
的
数据<
浏览 0
提问于2019-04-04
得票数 0
1
回答
初学者R:使用事件
数据
,创建一系列包含分类变量和
的
新
数据
帧
我想创建一个新
的
数据
帧
序列,对未
分组
的
数据
进行
分组
(即,与此链接中
的
第一步相反:)。我希望
数据
帧
包含上述最后两列中每一列
的
每个分类计数
的
每一年/每个州
的
总数(但每个年份-州组合只有一行),因此它将是两个单独
的
数据
帧
: Year State Sum of Criminal OffenseOffe
浏览 0
提问于2014-05-30
得票数 0
1
回答
pandas
数据
帧
中
的
函数,用于复制R中
的
dplyr group_by(多变量)函数
、
、
、
考虑一下这种情况: df = df%>% group_by(a,b) %>% 表示
数据
帧
首先按列a
分组
,
然后
按
b
分组
。在我
的
例子中,我尝试先按group_name列、
然后
按
user_name、再按type_of_work对
数据
进行
分组
。有三列以上(这就是我感到困惑
的
原因),但我需要根据这三个标题以相同
的
顺序对
数据</em
浏览 0
提问于2017-06-19
得票数 1
7
回答
是否同时对列和索引值对
pandas
数据
帧
进行排序?
、
、
、
按
列
的
值和索引对
pandas
dataframe进行排序是否可行? 如果
按
列
的
值对
pandas
数据
帧
进行排序,则可以得到
按
列排序
的
结果
数据
帧
,但不幸
的
是,您会看到
数据
帧
的
索引顺序与排序列
的
值相同。那么,我是否可以
按
列对
数据
帧
进行排序,例如名
浏览 2
提问于2013-11-29
得票数 59
1
回答
如果我有多个group by字段,如何从Dask DataFrameGroupBy中获取所有组?
、
、
如何从
分组
数据
框中获取Dask中
的
所有唯一组?假设我们有以下代码:我必须遍历所有组并处理组内
的
数据
。我
的
想法是获得所有唯一
的
值组合,
然后
遍历集合并调用。对于他们中
的
每一个人。这不会很快,但希望能起作用..在Spark&
浏览 3
提问于2018-02-20
得票数 4
3
回答
按
组和列求最小值
、
我
的
数据
的
一个小样本如下所示:1 a 1 3 5.04.06 b 1 5 1.0 我想
按
组
分组
,为每个组找到包含两个组分数中最小组得分
的
行,
然后
得到包含最小值
的</e
浏览 2
提问于2020-09-12
得票数 2
回答已采纳
1
回答
为什么股票代码和日期不同?
、
、
这是我使用Python
的
早期尝试。我正在从雅虎获得股票
数据
,但我可以看到股票代码,日期列标题低于高,低,开盘收盘价。import numpy as npimport
pandas
_datareader as pdr py.init_notebook_mode
浏览 3
提问于2020-04-08
得票数 2
1
回答
基于pyspark
的
均值漂移聚类
、
、
、
、
议程是对
数据
帧
(以前是
pandas
,现在是spark)进行一些
过滤
,
然后
按
user-ids对其进行
分组
,最后在顶部应用meanshift集群。我在
分组
数据
上使用
pandas
_udf(df.schema, PandasUDFType.GROUPED_MAP)。但现在,最终输出
的
表示方式出现了问题。假设我们在输入
数据
帧
中有两列:user-id和location。对于每
浏览 11
提问于2019-05-14
得票数 0
回答已采纳
1
回答
创建新
的
Pandas
分组
对象
、
、
在某些转换中,我似乎被迫脱离
Pandas
dataframe
分组
对象,而我想要一种返回到该对象
的
方法
。 给定一个时间序列
数据
帧
,如果
按
数据
帧
中
的
一个值
分组
,我们将获得一个从键到
数据
帧
的
底层字典。因为结构是dataframe
的
关键,所以不能使用.from_dict()将该结构转换回Dataframe。据我所知,返回
Pand
浏览 0
提问于2014-05-06
得票数 0
1
回答
以最
有效
的
方式对
Pandas
Dataframe进行排序和
过滤
、
我想
按
列名'duration‘
过滤
,
然后
显示大于200
的
值。这只是
数据
集
的
一小部分。我有一个非常庞大
的
数据
集。我可以使用dfdf.duration > 200。但是,这在整个
数据
帧
上运行。有没有什么
方法
可以专门针对列持续时间,
然后
过滤
数据
,只显示列持续时间,而不引入新
的
数据
帧
。
浏览 24
提问于2021-04-17
得票数 0
1
回答
如何将扩展窗口应用于groupby结果
的
名称?
、
我想使用
pandas
将
数据
帧
按
一列
分组
,
然后
对这些组运行扩展窗口计算。想象一下下面的
数据
帧
: G ValA 1B 3C 5 C 7 我正在寻找
的
是一种
按
列G对
数据
进行
分组
的
方法
(结果是组['A', 'B', 'C']),
然后
将函
浏览 14
提问于2021-11-15
得票数 0
回答已采纳
2
回答
按
数据
帧
中
的
每个组进行
分组
并获取其详细信息
、
、
、
我有一张这样
的
桌子: ---- ----- ---- ---- B 1 call 30 B 2 sadas 50 我需要先按用户
分组
,
然后
按
周
分组
,并处理一些
数据
。需要在
Pandas
中这样做,在将其加载到<em
浏览 0
提问于2017-04-23
得票数 0
回答已采纳
点击加载更多
热门
标签
更多标签
云服务器
ICP备案
腾讯会议
云直播
对象存储
活动推荐
运营活动
广告
关闭
领券