什么方法是最快的方式重复重采样相同形状的时刻表数据?
问题:我有30年的每小时时刻制,我想重新调整到年度和日历年度(重采样规则'AS')。我需要找出每年的平均值和金额。已经没时间了。对于我正在编写的脚本,这个重采样步骤花费的时间最多,也是优化运行时的限制因素。因为闰年,一个人不能像每四年有8784个小时一样,以一个持续的8760小时重新计算时间。print(f"Ran in {start
我正在处理每小时的时间序列(日期,时间(hr),P),并试图计算每个小时的每日总‘金额’的比例。我知道我可以使用Pandas‘resample('D',how=' sum ')来计算P (DailyP)的每日总和,但在相同的步骤中,我想使用每日P来计算每个小时的每日P的比例(因此,P/DailyP),从而得到每小时的时间序列(即,与原始频率相同的频率)。我不确定这是否可以被称为熊猫术语
这是一个在xarray和pandas中重采样时间序列的MWE。10Min重采样在xarray中需要6.8秒,在pandas中需要0.003秒。有什么方法可以让x数组中的Pandas速度提高吗?熊猫的重采样似乎独立于这个时期,而x阵列则随着时间的推移而变化。import numpy as npimport pandas as
我想用一个Timestamp (像重采样时间序列时,但只有一行)旋转(地板)一个Pandas Timestampfrom pandas.tseries.frequenciespd.Timestamp('2017-01-03 05:02:00')# to get pd.Timestamp('2017-01-03 05:00:00')
我想知道p
尝试将每日频率的数据转换为每周的频率。weeklyaaapl = pd.DataFrame()#that falls within the week. ValueError: .resample() is now a deferred operation
use .resample(...).mean() instea
我知道Pandas可以执行重采样,也可以对时间戳索引为浮点数的数据执行重采样:Pandas - Resampling and Interpolation with time float64 但是,我不确定如何将其应用于我的问题-我的数据有一个时间戳列,它是一个浮点数,含义是秒;这是test.csv Time[s], Channel 00.000008000000000