我定义了一个pandas udf函数,并希望将除pandas.Series或pandas.DataFrame之外的其他参数传递给udf函数。我想使用partial函数来做这件事,但它出错了。我的代码如下: from functools import partial
from pyspark.sql importSparkSession
from pyspark.s
我使用的是pyspark 2.4.2,所以对于这个版本的docs,可以这样做来创建一个GROUPED_MAP: from pyspark.sql.functions import pandas_udfPandasUDFType.GROUPED_MAP) v = pdf.v
df.groupby("id").apply(subtract_