我有一只熊猫df (前25排)。
{“开始日期”:{时间戳(“2007-07-02 00:00:00”):NaT,时间戳(“2007-07-03:00:00”):NaT,时间戳(“2007-07-05 00:00:00”):时间戳(‘2007-07-05 00:00:00“),时间戳(’2007-07-06: 00:00:00'):NaT,时间戳(‘2007-07-09 00:00:00”):NaT,时间戳(’2007-07-000:00:00‘):NaT,时间戳(“2007-07-11:00:00:00”):NaT,时间戳(“2007-07-12 00:00:00”):时间戳(“2007-07-12 00:00:00”),时间戳(“2007-07-13 00:00:00”):NaT,时间戳(‘2007-07-16 00:00:00:00“):NaT,时间戳(’2007-07-17 00:00:00”):时间戳(‘2007-07-17 00:00:00:00“)时间戳(“2007-07-18:00:00:00”):NaT,时间戳(“2007-07-19 00:00:00”):NaT,时间戳(“2007-07-20 00:00:00”):NaT,时间戳(‘2007-07-23:00:00:00“):NaT,时间戳(’2007-07-24:00:00:00”):NaT,时间戳(‘2007-07-25:00:00:00“):NaT,时间戳(’2007-07-26 00:00:00:00”):NaT,时间戳(“2007-07-27:00:00”):NaT,时间戳(“2007-07-30:00:00”):NaT,时间戳(‘2007-07-31:00:00:00“):NaT},'endDate':{时间戳(’2007-07-02:00:00:00”):NaT,时间戳(‘2007-07-03 00:00:00'):NaT,时间戳(’2007-07-05 00:00:00'):时间戳(‘2007-07-16 00: 00:00:00'),时间戳(“2007-07-06:00:00:00”):NaT,时间戳(“2007-07-09:00:00:00”):NaT,时间戳(“2007-07-10:00:00:00”):NaT,时间戳(‘2007-07-11:00:00:00“):NaT,时间戳(’2007-07-12:00:00:00”):时间戳(‘2007-07-25 00:00:00“),时间戳(’2007-07-13 00: 00:00:00'):NaT,时间戳(“2007-07-16:00:00:00”):NaT,时间戳(“2007-07-17:00:00:00”):时间戳(“2007-07-30 00:00:00”),时间戳(“2007-07-18 00:00:00:00”):NaT,时间戳(‘2007-07-19 00:00:00:00“):NaT,时间戳(’2007-07-2000:00:00”):NaT(‘2007-07-23 00:00:00:00“):NaT,时间戳(“2007-07-24:00:00:00”):NaT,时间戳(“2007-07-25 00:00:00”):NaT,时间戳(‘2007-07-26:00:00:00“):NaT,时间戳(’2007-07-27:00:00:00”):NaT,时间戳(‘2007-07-30:00:00:00“):NaT,时间戳(’2007-07-31:00:00:00”):NaT},‘’Value1 1‘:{时间戳(’2007-07-02 00:00:00'):112.9156,时间戳(‘2007-07-03 00:00:00'):113.3248,时间戳(’2007-07-05 00:00:00:00“):113.2057,时间戳(‘2007-07-06 00:00:00:00”):113.8009,时间戳(’2007-07-09: 00:00:00'):113.8157,时间戳(‘2007-07-10: 00:00:00'):112.2684,时间戳(“2007-07-11:00:00:00”):113.0644,时间戳(“2007-07-12 00:00:00”):114.8497,时间戳(‘2007-07-13:00:00:00“):115.1919,时间戳(’2007-07-16:00:00:00”):115.1771,时间戳(‘2007-07-17: 00:00:00'):115.1175,时间戳(’2007-07-18:00:00:00“):114.9093,时间戳(“2007-07-19:00:00:00”):115.3556,时间戳(“2007-07-20:00:00:00”):114.1877,时间戳(‘2007-07-23:00:00:00“):114.5373,时间戳(’2007-07-24:00:00:00”):112.5511,时间戳(‘2007-07-25: 00:00:00'):112.7817,时间戳(’2007-07-26:00:00:00“):110.1111,时间戳(“2007-07-27 00:00:00”):107.9464,时间戳(“2007-07-30 00:00:00”):109.6351,时间戳(‘2007-07-31:00:00:00“):108.4002}
指数'Date‘是dt,是连续的每日数据。我还有另外两个dt cols,'startDate‘和'endDate’。对于' startDate‘和' endDate’中的每一行,即!= NaT,我需要在startDate和endDate之间找到'Value1‘的最大值和最小值。每个'startDate‘和'endDate’都在索引中。
我无法删除NaT,否则会丢失可能包含最大值/分钟的行。
我该怎么做?
发布于 2022-08-31 15:06:31
尝试:
df.apply(lambda row: df.loc[row['startDate'] : row['endDate'], 'Value1'].max(),
axis=1)
对于min,只需将max
替换为min
即可。
发布于 2022-09-01 19:59:35
我回答了我自己的问题。为所有的文字和格式道歉,但可能对某人有帮助:
的连续数据。
s1 = dfT.reindex(np.searchsorted(df2['entryDate'], df['Date'], side='right')-1)
s2 = dfT.reindex(np.searchsorted(df2['exitDate'], df['Date'], side='right')-1)
这会产生每个事件的唯一索引,但分布在df.中的所有行中。
s1 = s1.reset_index()
s1 = pd.concat([s1, s2], axis=1)
连接起来
https://stackoverflow.com/questions/73557896
复制相似问题