我有一个包含以下列的cuDF数据帧: columns = ["col1", "col2", "dt"] datetime64[ns]形式的(dt)。我想写一个UDF来应用于这个数据帧中的每个组,并获得每个组的最大dt。这就是我正在尝试的,但是numba似乎不支持UDF中的datetime64[ns]值。cuda.blockDim.x):
if d
我正在尝试编写一个函数,它的功能类似于pandas的groupby().ngroups() function。不同之处在于,我希望每个子组计数从0开始。EVENT_1执行groupby(),在每个组中获取EVENT_2的唯一值,然后将EVENT_2A设置为唯一值的索引。import cudfimport numpy as np
# Get unique(