腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
有没有
办法
在
groupby
中
优化
pandas
应用
函数
?
python
、
pandas-groupby
201601,201601,201602,201602,201603,201601,201604,201603,201601,201601,201602,201607)}) 获取所需df_2的代码: df1 = df_toy.
groupby
pd.Series).reset_index() df2 = df1.
groupby
我正在寻找
优化</e
浏览 18
提问于2019-02-12
得票数 0
回答已采纳
1
回答
有没有
办法
在
Spark
中
实现矢量化的UDF?
python
、
pandas
、
pyspark
在
Pandas
中
,您可以这样做: @
pandas
_udf(df.schema, PandasUDFType.GROUPED_MAP) returnpdf.assign(v=pdf.v - pdf.v.mean()) df.
groupby
('id').apply(subtract_mean) 我们
有没有
办法
在
Spark
中
做到这一点?因此,基本上,将自定义<em
浏览 26
提问于2021-11-09
得票数 0
1
回答
如何在不重新加载大型CSV的情况下执行多个Dask计算
python
、
dask
我目前正在使用Dask将数据预处理成一些聚合的统计数据,然后使用常规的
Pandas
进一步分析。 我遇到的问题是Dask会在每次调用compute()时重新加载数据。groupstats_A = ddf.
groupby
(['col1', 'col2']) \ .compute()
浏览 15
提问于2019-03-22
得票数 1
回答已采纳
0
回答
Dataframe
中
的
Pandas
中
的聚合列
python
、
pandas
、
dataframe
、
pandas-groupby
我使用
groupby
()和reset_index()
函数
使用来自
Pandas
Dataframe的数据创建具有聚合值的列: df1=data.
groupby
(["subscription_id"])["product"].co
浏览 5
提问于2017-06-13
得票数 0
回答已采纳
5
回答
GroupBy
对象的Python滚动
函数
python
、
pandas
、
pandas-groupby
、
rolling-computation
、
rolling-sum
我有一个<
pandas
.core.
groupby
.SeriesGroupBy object at 0x03F1A9F0>类型的时序对象grouped。grouped.sum()提供了所需的结果,但我无法让rolling_sum使用
groupby
对象。
有没有
办法
将滚动
函数
应用
于
groupby
对象?range(0, 6) id = ['a', 'a', 'a', 'b
浏览 138
提问于2012-12-22
得票数 70
回答已采纳
5
回答
熊猫群的意思是()不忽略NaNs。
python
、
pandas
、
dataframe
、
nan
如果我计算一个
groupby
对象的平均值,并且在其中一个组中有一个NaN(s),那么NaNs就会被忽略。即使
在
应用
np.mean时,它仍然返回所有有效数字的平均值。我希望
在
组内有一个NaN时立即返回NaN。这里是一个简化的行为示例import numpy as npc.
groupby
('b&
浏览 0
提问于2019-01-09
得票数 11
回答已采纳
1
回答
使用用户定义的
函数
或向量化的
函数
替代
优化
Groupby
.apply()
pandas
、
numpy
、
apply
、
pandas-groupby
我正在尝试
优化
或避免
pandas
Groupby
.apply()方法,该方法接受我的用户定义
函数
并将其
应用
于每个ID初始数据帧2222 NAN 2 33333 6 NAN 5I
在
ID级别分组,并调用
应用
函数
,该
浏览 3
提问于2019-07-04
得票数 0
2
回答
如何在python
pandas
中使用
groupby
连接字符串?
python
、
pandas
、
grouping
我目前
在
顶部有数据帧。
有没有
办法
使用
groupby
函数
来获取另一个数据帧来对数据进行分组,并将单词连接成下面使用python
pandas
的格式?[
浏览 0
提问于2016-06-30
得票数 8
回答已采纳
1
回答
在
Pyspark
中
,当您
groupBy
与partitionBy中使用的列相同的列时会发生什么?
apache-spark
、
pyspark
、
pyspark-sql
这会导致每个分区
在
文件系统
中
获得自己的文件夹。现在我正在读回这些数据,并想先调用
groupBy
('ID'),然后再调用一个
pandas
_udf
函数
。我的问题是,既然数据是由ID分区的,那么
groupBy
('ID')会比没有分区的数据快吗?例如,使用文件夹结构一次读取一个ID是不是更好?我担心
groupBy
操作会遍历每条记录,即使它们已经被分区。
浏览 1
提问于2019-11-07
得票数 0
1
回答
从
Pandas
Series创建Python Spacy NLP对象的最佳方法
python
、
pandas
、
vectorization
、
spacy
我想从存储
在
Pandas
数据框列
中
的25万字符串对象
中
创建Spacy nlp对象。
有没有
办法
优化
下面的“
应用
”方法,也就是说,
有没有
办法
向量化spacy nlp对象的调用?import
pandas
as pd df = pd.DataFrame({"id":
浏览 18
提问于2020-07-23
得票数 1
回答已采纳
1
回答
Pandas
/
Groupby
/
应用
优化
python
、
pandas
、
pandas-groupby
、
pandas-apply
在
pandas
结构中使用重复的cols名称,基本上我正在尝试做与这篇文章相同的事情:
有没有
办法
优化
链接帖子中提到的代码?也许可以找到一种方法来告诉
Pandas
从13到42只连接到
GroupBy
cols,并且只连接这个区域中的字段。 非常
浏览 18
提问于2020-07-30
得票数 0
1
回答
Pandas
groupby
和qcut
python
、
group-by
、
pandas
有没有
办法
构造
Pandas
、
groupby
和qcut命令,以返回一个嵌套了tiles的列?具体地说,假设我有两组数据,我希望对每组
应用
qcut,然后将输出返回到一列。C1 foo 0.5 23 bar 0.1 15 bar 1.0 3 在上面的数据框
中
,我希望将qcut
函数
应用
于B,同时
在
A上进行分区以返回C。
浏览 2
提问于2013-10-16
得票数 32
回答已采纳
1
回答
如何在dask
中
执行group-by聚集后保留分区
python
、
pandas
、
dataframe
、
distributed
、
dask
在
我的
应用
程序
中
,我使用
groupby
对dask数据帧执行聚合,并按某个id排序。import numpy as npdf.index.name = 'my_id' ddf = dd.f
浏览 0
提问于2018-02-17
得票数 4
1
回答
pandas
:如何在
应用
中
同时使用
groupby
对象的名称和数据帧
python
、
pandas
我有一个
pandas
groupby
对象,创建方法是
在
具有列id的dataframe df上。for id, group in g:
有没有
更好(更快)的方法来使用apply或类似的方法来实现这一点?
浏览 0
提问于2014-03-13
得票数 1
2
回答
如何为分组
中
的每一列创建多个汇总统计信息?
python
、
pandas
、
grouping
使用
groupby
().agg()可以计算指定列的汇总统计信息。但是,如果我想为每组数据帧的每一列计算“min”、“max”和“mean”,该怎么办?
有没有
办法
让
pandas
自动为每个列名附加一个前缀?我不想枚举agg()
函数
中
的每个基本列名。
浏览 8
提问于2021-07-20
得票数 0
1
回答
将
函数
应用
于
pandas
数据帧
中
的组
python
、
numpy
、
pandas
、
dataframe
我正在尝试将简单的
函数
应用
于
pandas
中
的组。", "Y", "Y"]}).set_index("id")我想在取每个组的平均值之前,只对组
应用
一个像np.log2这样的
函数
。这不起作用,因为apply是以元素为单位的,而type (以及实际场景
中
df<em
浏览 0
提问于2013-08-09
得票数 10
回答已采纳
1
回答
熊猫通过尝试
优化
几个步骤
pandas-groupby
我一直
在
尝试
优化
一个bokeh服务器,以便在Covid19上计算选定国家的实时统计数据。我发现自己重复了一个
groupby
函数
来计算新列,并且想知道,
在
选择了
groupby
之后,我是否可以以类似的方式将它
应用
到多列上的.agg()?03/2020我需要创建基于“案例”和“死亡”的新列,并
应用
浏览 3
提问于2020-05-16
得票数 0
回答已采纳
1
回答
传递什么
Pandas
数据类型来
在
一个组中转换或
应用
python
、
pandas
在
尝试调试
groupby
函数
应用
程序时,我使用一个虚拟
函数
来为每个组“查看传递给
函数
的内容”的。当然,我
在
玩游戏:import
pandas
as pd 这将使我的标准输出
中
包含以下内容: single column trans
浏览 5
提问于2013-12-19
得票数 6
回答已采纳
1
回答
访问
groupby
列值
pandas
、
group-by
、
resampling
如果我
在
pandas
中使用了
groupby
函数
(
在
LOC上),并进行了重采样,例如,我可以获得某个地点的日平均压力和流量值。
有没有
办法
访问
groupby
列
中
的值,LOC,按索引或其他方法,以便我可以将其用作绘图的标题。换句话说,我可以访问“venue1”吗?我不得不使用
groupby
来获取重采样数据帧
中
的venue列,因为重采样似乎不会带来任何非数字字段
浏览 10
提问于2020-06-27
得票数 0
2
回答
Pandas
dataframe
在
groupby
agg之后有额外的标头
python
、
pandas
、
pandas-groupby
KLHL17我想对基因匹配的值进行平均,所以我使用 common_mouse = common_mouse.
groupby
有没有
一种方法可以防止或删除列标题中的新“average”字段?
浏览 25
提问于2018-08-23
得票数 2
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
在Pandas中通过时间频率来汇总数据的三种常用方法
Pandas 2.0 vs Polars:速度的全面对比
Pandas分组与聚合(一)
Python 数据分析之NumPy与pandas 的功用
你可能不知道的10个Python Pandas的技巧和特性(下)
热门
标签
更多标签
云服务器
即时通信 IM
ICP备案
对象存储
实时音视频
活动推荐
运营活动
广告
关闭
领券