如何在PySpark SQL中实现用户定义的聚合函数?pyspark version = 3.0.2作为一个最小的例子,我想用一个UDAF替换AVG聚合函数:sql)rv = sql.sql('SELECT id, AVG(value) FROM df GROUP BY id').toPandas()
rv将位于的位置impo
我定义了一个pandas udf函数,并希望将除pandas.Series或pandas.DataFrame之外的其他参数传递给udf函数。我想使用partial函数来做这件事,但它出错了。我的代码如下: from functools import partial
from pyspark.sql importSparkSession
from pyspark.s