下面的代码片段是用Pandas编写的。grouped = df.groupBy('episode_id')ops = dictops.update({f:('entropy',get_entropy) for f in categorical_features})我如何将其转换为与Pyspark兼容<em
我定义了一个pandas udf函数,并希望将除pandas.Series或pandas.DataFrame之外的其他参数传递给udf函数。我想使用partial函数来做这件事,但它出错了。我的代码如下: from functools import partial
from pyspark.sql importSparkSession
from