腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
如何
使用
python
pandas
对
新
字段
进行
分组
和
计算
?
python
、
pandas
、
dataframe
、
pandas-groupby
我想按数据框中名为“fruit”的特定列
进行
分组
,并
计算
该特定水果中“好”的百分比。有关我的初始数据框架,请参阅下面的内容 import
pandas
as pd0 Apple 50
浏览 18
提问于2021-10-24
得票数 3
回答已采纳
1
回答
如何
对
与
Pandas
创建的每个组相关的一系列数据求和?
python
、
pandas
、
pandas-groupby
在
Python
pandas
数据框中,假设我
使用
pandas
groupby()方法对数据
进行
分组
,结果如下:import
pandas
as pd data = p
浏览 0
提问于2018-08-05
得票数 0
1
回答
如何
在
python
中按相同的签入日期
和
签出日期对日期数据
进行
分组
/计数?
python
、
pandas
、
date
、
group
我试图根据相同的签入
和
签出日期对日期数据
进行
分组
,例如:check_in = ['17/07/2021', 'pd.DataFrame({'guess':guess, 'check in date': check_in, 'check out date': check_out})
浏览 3
提问于2022-07-17
得票数 0
回答已采纳
1
回答
如何
在
Python
中读取、
分组
和
计算
大型CSV文件
python
、
pandas
、
dataframe
、
pyspark
该文件基本上具有头文件
和
逗号分隔值。关键
字段
有月、日、年、拼码、计数。 Count表示该PIN码的事故计数,但是每个PIN码可以在一天中获得多个条目,例如每隔几个小时。因此,我希望能够
计算
在给定日期每个PIN码的最大事故数,即我需要按月、日、年、PIN码
分组
,然后在
分组
后求和计数?如果我将大文件加载到数据库或云服务(如GCP BigQuery )中,我知道
如何
完成此操作,但我希望能够
使用
Python
/
Pandas
dataf
浏览 22
提问于2021-09-23
得票数 0
1
回答
要使sum抛出循环
python
、
loops
、
filter
、
data-science
我有一个列表中的状态列表,我想过滤得到所有国家
分组
由总贷款的国家和总和的贷款要求&总和的国家,我正在
使用
下面的代码,请指导我在哪里我错了,我可以做得更好。
浏览 22
提问于2019-08-25
得票数 0
1
回答
PySpark:带有标量
Pandas
的无效returnType
apache-spark
、
pyspark
、
apache-arrow
from pyspark.sql.functions import
pandas
_udfimport numpy as np 116 except TypeError: 65 C:\opt\spark\spark-2.3.0-bin-
浏览 2
提问于2018-03-26
得票数 5
回答已采纳
1
回答
熊猫一片片串在一起
python
、
pandas
、
dataframe
我有一个dataframe,我想按ID
字段
的第一部分
进行
分组
。例如,假设我有以下内容:>>> df=pd.DataFrame(data=[['AA',1],['AB',4],['AC',5],['BA',11],[df0 AA 12 AC 54 BB
浏览 1
提问于2015-12-30
得票数 6
回答已采纳
1
回答
Apache读取csv文件
和
groupbykey
python
、
json
、
group-by
、
apache-beam
、
apache-beam-io
我有一个csv文件,我知道
如何
使用
pandas
实现这一点,基本上将csv作为一个df ->组按
字段
‘aaa’、‘bbb’读取数据,然后构造一个
新
的'id‘。我的问题是
如何
在Apache Beam中实现相同的功能,我以前从未
使用
过它,我试图
使用
Beam读取这个csv文件
和
分组
多个记录,但是我
对
熊猫
使用
的相同功能不支持Beam,下面是我的当前代码:我的
浏览 2
提问于2021-08-16
得票数 0
回答已采纳
1
回答
如何
在
Python
Pandas
中
进行
嵌套循环类型的操作?
python
、
pandas
、
dataframe
、
loops
、
subset
我需要找到一个子集的子集,并且需要迭代地
进行
,然后在这个子集的每个实例上
计算
一个值,然后将其保存到一个
新
的输出表中。为了更好地解释,我有一个类似于下图所示的数据框; 我需要迭代数据集,并
对
团队A(组2)的所有人员1(组1)的成本求和。然后移动到人员2,并
对
所有团队再次执行相同的操作。 示例如下: ? , Team, Newcost) 然而,我是
Python
和
pandas
的新手,我发现很难
使用
相同的方法,因为我有一个数据帧设置<e
浏览 18
提问于2020-08-24
得票数 0
1
回答
组与公式
和
列的可变数
python
、
formula
、
pandas-groupby
我需要创建一个具有可变列数的
分组
数据框架,其中已经
计算
了
字段
。问题是
如何
使它假设我将有多个列组
和
多个
分组
条件。
浏览 1
提问于2019-07-25
得票数 0
回答已采纳
1
回答
计算
并广播
pandas
中的计数(
使用
groupby转换)
python
、
pandas
、
aggregation
、
split-apply-combine
我
如何
计算
和
广播一个熊猫的计数?要
计算
计数,请执行以下操作: df.groupby('field').size() 要向原始数据帧广播聚合,请执行以下操作: df.groupby('field')['field_to_aggregate'].transform(aggregation) 如果我指定要聚合到的
字段
和
聚合(如sum、mean等),则后者可以工作。但是,当我想要简单计数
分组
字段
时,我
浏览 34
提问于2020-11-25
得票数 1
1
回答
在
Python
中
使用
pandas
基于条件
进行
计数
python
、
pandas
我
使用
的是
pandas
,我想要
计算
符合特定条件的行数,但我想要在不同的级别
进行
计数。CD 03 Advanced PD 02 Advanced values.append(sum(g['Method'] ==
浏览 33
提问于2019-03-20
得票数 0
回答已采纳
2
回答
熊猫pivot_table不
分组
python
、
pandas
、
pivot-table
在不提供
分组
的情况下,
使用
pandas
.pivot_table
计算
整个表上的聚合函数的最佳方法是什么?例如,如果我想将A、B、C的
和
计算
成一个有一行的表,而不按任何列
进行
分组
:>>>(keys) File "/to
浏览 10
提问于2015-07-01
得票数 2
回答已采纳
2
回答
按数据
分组
的
Pandas
之和(
Python
)
python
、
pandas
、
dataframe
对于我的任务,我需要理解一些
Python
代码,以便
进行
一些修改,并
使用
另一种编程语言(Java)重新实现它。我参加了一些在线教程,但仍然
对
Pandas
有问题。uniq_page_df.sum().reset_index()在这一部分中,据我所知,作者试图
计算
出总视图数所以我的问题是,为什么我们需要对每个组(第2行)
进行
分组</e
浏览 1
提问于2018-03-01
得票数 0
回答已采纳
3
回答
Pandas
: df.groupby()对于大数据集来说太慢了。有什么替代方法吗?
python
、
pandas
、
grouping
、
bigdata
我有一个有380万行
和
一列的
pandas
.DataFrame,我尝试按索引
对
它们
进行
分组
。df = df.groupby(df.index).sum()<class '
pandas
.core.frame.DataFrame'> Index: 3
浏览 1
提问于2017-06-23
得票数 15
2
回答
群熊猫数据与
计算
多列均值
python
、
pandas
、
dataframe
、
pandas-groupby
我试图将熊猫的数据按列
分组
,然后
计算
出多个列的平均值。在下面的示例中,我想按“类别”列
进行
分组
,然后
计算
“得分”
和
“优先级”列的平均值。所有三列都应位于生成的dataframe中。我能够
对
第一列
进行
分组
并
计算
平均值,但我不知道
如何
添加第二列。在我的尝试之下。 data = [['A', 2, 1],
浏览 3
提问于2022-05-24
得票数 1
回答已采纳
3
回答
如何
将所有列保存在一个dataframe中,加上添加groupby
和
sum?
python
、
python-3.x
、
pandas
我有一个有5个
字段
的数据框架。我想将两个
字段
从这个复制到一个
新
的数据框架中。这个很好用。df1 = df[['task_id','duration']] See the caveats in the documentation: h
浏览 0
提问于2018-12-05
得票数 0
回答已采纳
1
回答
JuliaDB或DataFrame比平面数组快吗?
julia
我想知道普通数组与JuliaDB或DataFrame在对大型数据集(大型但仍然适合内存)上的
计算
性能是否存在差异?我可以
使用
简单的数组
和
算法来
进行
排序、
分组
、缩减等等,那么为什么我需要JuliaDB或DataFrame呢?我有点理解
Python
为什么需要
Pandas
--因为它将缓慢的
python
转化为快速C,但是为什么Julia需要JuliaDB或DataFrame -- Julia已经快了。
浏览 0
提问于2018-03-26
得票数 10
回答已采纳
1
回答
熊猫,数据,群,性病
python
、
pandas
、
statistics
我想按主机
分组
,然后按host+operation
分组
,
计算
每个主机执行时间的std偏差,然后根据host+operation
对
计算
std偏差。看起来很简单?它适用于按单个列
进行
分组
:Out[360]:Int64Index: 132564 entries, 0 to 132563_wrap_agged_blocks(new_blocks
浏览 0
提问于2013-12-03
得票数 7
回答已采纳
1
回答
熊猫条件切片,同时
使用
“
和
”
和
“或”
python
、
pandas
我在谷歌或这里找不到答案(
对
谷歌来说很难)。我试图选择符合某些条件的数据。这是我代码中的一个片段。
浏览 5
提问于2020-10-02
得票数 2
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
土地利用现状数据转移矩阵制作的两种方法
这几个方法颠覆你对Pandas缓慢的观念!
还在抱怨pandas运行速度慢?这几个方法会颠覆你的看法
Python干货:自动整理Excel表格
Python实战:自动化办公:Python 自动整理 Excel 表格
热门
标签
更多标签
云服务器
ICP备案
实时音视频
对象存储
云直播
活动推荐
运营活动
广告
关闭
领券