我试图创建一个返回interpolation函数的UDF,但该函数返回一个序列,带有索引并抛出异常。from pyspark.sql.types import FloatType
def3.02 1.0
Name: _0, dtype: float64 with type Series: tried to convert to float32 我尝试强制转换为
我想执行一个累积的产品,以前成功的答案使用对数和的契据。但是,是否有一种方法来使用Numpy累计。我尝试过,但没有得到明确的结果,下面是我的代码: """Calculation of cumulative product using numpy function cumprod. return np.cumprod(float(x)).tolist()
spark_cumulative_product = udf(