我有一个包含事件的DataFrame,每个事件都有开始日期和结束日期。我还有一个报告期,包括开始日期和结束日期以及报告频率,例如每月。我想要计算的是每个报告期间bin中“活动”事件的数量。import numpy as npimport datetime as dt
# Create an additional colmun in the datafra
我试图编写一个高效的函数,它将使用一个平均大小的dataframe (~5000行),并返回一个带有最新年份(以及相同索引)列的数据,这样对于原始数据的每个日期索引,包含该日期的月份介于一些预先指定的开始日期(st_d)和结束日期(end_d)之间。我编写了一段代码,在该代码中,某个特定日期索引的年份将减少,直到该月份处于所需的范围内。然而,它确实是缓慢的。对于只有366个条目的dataframe,它需要~0.2s。import pandas as pd
import numpy as