我正在处理一个数据集,该数据集有大约2600万行和13个列,其中包括两个datetime列arr_date和dep_date。我正在尝试创建一个新的布尔列,以检查在这些日期之间是否有任何美国假日。我正在对整个dataframe使用apply函数,但是执行时间太慢。代码已经在Goolge平台上运行了超过48个小时(24 on内存,4核)。有更快的方法吗?数据集如下所示:import pandas a
我把我的daskdataframe字符串日期列转换为一个熊猫日期时间,它创建了一个datetimeindex。当我尝试将它重新分配给源daskdataframe时,使用ValueError: Length of values (1000000我最初认为create索引有正确的长度,但是源只有2个indeces。我尝试将datetimeindex转换为pd.<
我有一个带有date列的pandas数据框,并且我正在尝试添加一个新的布尔值列,用于指示给定的日期是否为假日。以下是代码,但它不起作用(所有的值都是False),因为类型似乎不同,我不知道如何使pandas数据框中的'date‘与假日的类型相同:
cal = USFederalHolidayCalen