腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
pandas
DataFrame
中
组
内
相对
大小
的
计算
python
、
pandas
、
dataframe
我有一个每日
大小
的
DataFrame
size,基于第二个
DataFrame
group,我尝试
计算
每天
组
内
的
相对
大小
。size = pd.
DataFrame
({ 'Date':['2021-01-01', '2021-01-02', '2021-01-03', '2021-01-04', &
浏览 33
提问于2021-11-19
得票数 0
回答已采纳
1
回答
Pandas
dataframe
组
内
的
计算
python
、
dataframe
、
pandas-groupby
我有
Pandas
Dataframe
,如下所示。我要做
的
是,partition (or groupby) by BlockID, LineID, WordID,然后在每个
组
中使用current WordStartX - previous (WordStartX+ WordWidth)派生另一列,例如,WordDistance来表示这个单词与前一个单词之间
的
距离。这篇文章非常有用,但在我
的
例子
中
涉及多个列(WordStartX和WordWidth)。
浏览 1
提问于2016-11-08
得票数 2
回答已采纳
1
回答
为什么
dataframe
会变成一个系列?
python
、
pandas
、
dataframe
、
series
为什么下面的函数groupby().size()将
dataframe
更改为一个系列?在第一行
中
,我返回info()函数
的
结果,但在第三行,我收到一个错误。“串联”对象没有属性'info‘。df_injury_record.info())print(test.info()) 当我想要将它放在
dataframe
中
时,这个函数是什么样子
的
?
浏览 0
提问于2020-01-25
得票数 0
回答已采纳
1
回答
频率和百分比不均匀
组
sns条形图
python
、
python-3.x
、
pandas
、
matplotlib
、
seaborn
我试图在sns柱状图中显示每个
组
的
相对
百分比以及总频率。我比较
的
两个
组
在
大小
上非常不同,这就是为什么我在下面的函数
中
按
组
显示百分比
的
原因。下面是我创建
的
一个样本数据帧
的
语法,它在目标分类变量('item')
中
具有与我
的
数据(‘group’)相似的
相对
组
大小
。‘'rand’只是我用来
浏览 12
提问于2017-06-26
得票数 5
回答已采纳
1
回答
Pandas
DataFrame
-将行拆分为n个窗口,按m个元素移动窗口,查找平均值
python
、
pandas
、
dataframe
我有一个
DataFrame
,该列包含(例如) 30行,您需要将它们拆分为5个元素
的
窗口,将每个窗口
相对
于另一个窗口移动4个元素,并沿行找出平均值。应该还剩下10行。窗口
的
行数和
大小
可以是任意
的
。在
pandas
中
,有没有一种移动窗口和
计算
值
的
机制?
浏览 4
提问于2021-02-16
得票数 2
2
回答
如何在忽略空值
的
情况下获取列
中
每个
组
的
计数
python
、
dataframe
、
pandas-groupby
我尝试在忽略空值
的
情况下获取列
中
每个
组
的
计数。2 yy 163 xx 123 null 12A B2 3使用
的
代码
浏览 21
提问于2020-11-12
得票数 0
1
回答
熊猫群群
中
忽略NaN
的
标准错误
python
、
numpy
、
pandas
、
scipy
、
nan
我已经将数据加载到具有多个列标题索引
的
dataframe
中
。目前,我一直在按列索引对数据进行分组,取
组
的
平均值,
计算
95%
的
置信区间,如下所示:import
pandas
as pdci = grouped.aggregate(lambda x: st.sem(x) * 1.96
浏览 8
提问于2013-08-04
得票数 9
回答已采纳
1
回答
使用Python
Pandas
使用每日数据
计算
的
月平均值
python
、
pandas
、
time-series
我有一个包含四列
的
文本文件:年、月、日和积雪深度。这是30年
内
,1979-2009年
的
每日数据。我想使用熊猫
计算
360 (30年x 12个月)个人月平均值(即隔离1979年1月-1979年,1979年2月-1979年
的
所有值,...2009年12月-2009年12月,平均每个月)。
浏览 2
提问于2015-04-21
得票数 8
回答已采纳
1
回答
Pandas
dataframe
的
群
内
计算
python
、
pandas
、
grouping
、
dataframe
我有以下形式
的
数据:AA 201205 1AA201410 7BB 201309 1日期是yyyymm
的
形式我希望根据“code”列
中
的
值对数据进行分组,并将过去6个月和之前所有时间
的
每个代码值
的
计数值
浏览 0
提问于2014-10-19
得票数 1
回答已采纳
1
回答
如何在spark中使用
pandas
split-apply-combine风格策略和scala api?
pandas
、
scala
、
apache-spark
、
split-apply-combine
我有一个scala函数,它接受一个spark
dataframe
并返回一个单值,也就是说两个值。这个函数很复杂,使用在
DataFrame
类
中
定义
的
聚合,调用其他java库,并且不能用SQL表达。它需要整个数据帧
的
内容来进行
计算
,它不能一次添加一行并建立一个结果。 我有一个大
的
dataframe
,其中包含一个列,我想用它将
dataframe
分成小块,并对每个小块执行上述
计算
。然后,我想返回一个新
的
数据
浏览 28
提问于2020-04-22
得票数 0
1
回答
为什么matplotlib.pyplot.savefig()会给非常大
的
pandas
.plotting.scatter_matrix()图像输出造成混乱?
python
、
pandas
、
dataframe
、
matplotlib
我试图为非常大
的
pandas
.plotting.scatter_matrix()
计算
pandas
.
DataFrame
()值(
相对
地说,对于这个特定
的
操作,大多数库要么大部分时间运行OOM,要么实现50000我想要
的
Q1 我尝试使用matplotlib和modin.
pandas
.DataFrames对每对进行循环,通常(如文档
中
的
示例所示),所以我想要做
的
索引和操作/<
浏览 1
提问于2021-07-29
得票数 0
回答已采纳
3
回答
如何将Dask.
DataFrame
转换为pd.
DataFrame
?
python
、
pandas
、
dask
如何将生成
的
dask.
DataFrame
转换为
pandas
.
DataFrame
(假设我已经完成了繁重
的
任务,只想将sklearn应用到聚合结果
中
)?
浏览 27
提问于2016-08-18
得票数 43
回答已采纳
2
回答
在
pandas
.
DataFrame
中
查找下一个值
组
的
行号
python
、
pandas
、
dataframe
我有一个数据框架,其值分组如下:A =
pandas
.
DataFrame
([['a',0],['b',1],['ba',1],['c',2],['cd',2],columnsvalue group23 b 112 c 2我跟踪
组
的
行号cur
浏览 2
提问于2019-03-01
得票数 0
回答已采纳
1
回答
Partition上
的
聚合-
pandas
Dataframe
python
、
pandas
、
group-by
、
dataframe
、
partition
我正在寻找基于特定分区聚合值
的
最佳方法,它相当于在
Pandas
中
,我可以通过以下步骤做到这一点,但我正在寻找一种我确信应该存在
的
本机方法 TempDF= TempDF.reset_index
浏览 2
提问于2016-03-10
得票数 23
1
回答
我如何在金字塔框架
内
的
请求之间缓存/记忆
pandas
DataFrame
(昂贵
的
计算
)?
python-3.x
、
pandas
、
pyramid
()我有一个
计算
命中率
的
类。
计算
和数据检索过程相当昂贵。因此,对于给定
的
一
组
参数,我希望持久化"calculate_hits“
的
结果。我希望这样做,以便在片刻或几个小时后再次需要这些结果时,不需要再次进行
计算
和检索。我天真地尝试将输出结果放入金字塔框架
内
的
会话对象
中
。这不起作用,因为熊猫数据帧太大了…(可能还有其他问题)。[有关其他上下文:我正在<e
浏览 14
提问于2017-02-15
得票数 1
回答已采纳
1
回答
使用
pandas
数据帧高效地搜索数据
pandas
、
dataframe
、
search
10个客户
的
详细信息,并将它们放入3个不同
的
新csv文件
中
。也就是说,对于每个客户(从10个客户),我想从file1
的
cust_id,fname,lname,并将结果放在新
的
csv文件
中
,cust_id,prod_id,价格,日期从file2放在新
的
csv文件
中
的
结果,prod_id,prod_code,价格,数量从file3放在新
的
csv文件
中
的
结果。代码: import <em
浏览 19
提问于2020-08-06
得票数 0
1
回答
如何使用
dataframe
列值作为键将dask
dataframe
转换为字典
dictionary
、
dask-dataframe
将熊猫作为pd导入df =pd.
DataFrame
(数据){'a':1,2,'b':3,4}ddf = from_
浏览 4
提问于2022-08-16
得票数 -1
3
回答
Python
Pandas
:当分组和N>
组
大小
时如何采样?
python
、
pandas
、
pandas-groupby
我想从一个分组
的
熊猫
DataFrame
中
采样,其中
的
组
大小
有时小于N。在下面的示例
中
,当
组
大小
为3时,我如何采样3,否则
组
中
的
所有成员?我正在尝试下面的方法,但我得到了一个错误消息:“当‘replace=False’时,不能接受比总体更大
的
样本”。import
pandas
as pd df = pd.
DataFrame
({
浏览 0
提问于2017-10-25
得票数 1
1
回答
Pandas
groupby:获取一个
组
的
大小
,知道它
的
id (来自.grouper.group_info[0])
python
、
group-by
、
pandas
在下面的代码片段
中
,data是一个
pandas
.
DataFrame
,indices是data
的
一
组
列。使用groupby对数据进行分组后,我对
组
的
I感兴趣,但只有那些
大小
大于阈值
的
组
(比方说: 3)才感兴趣。group_ids=data.groupby(list(data.columns[list(indices)])).grouper.group_info[0] 现在,我如何知道哪个
组
的<
浏览 5
提问于2013-07-30
得票数 19
回答已采纳
2
回答
如何在
Pandas
中
过滤Groupby标准?
python
、
pandas
、
pandas-groupby
假设下面的设置是人为
的
:d = {'fname': ['bob', 'Bob', 'larry', 'LARRY', 'Larry', 'Dick'],(df.fname.str.lower()) 简单地说,我想为名字在查询
中
的
浏览 1
提问于2017-10-24
得票数 1
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
Python数据可视化之pandas入门
排序,分组,组内排序
肝了3天,整理了90个Pandas案例
Python数据处理(6)-pandas的数据结构
Python数据分析常见库介绍之Pandas
热门
标签
更多标签
云服务器
ICP备案
实时音视频
即时通信 IM
对象存储
活动推荐
运营活动
广告
关闭
领券