我想像这样使用ROUND函数:在火星雨里。在Dataframe和SQL ROUND函数中,第一个参数作为col,第二个参数作为int号,但我想将第二个参数作为另一列传递。如果我试图使用第二个参数作为第二个参数,那么它就是给出了错误column is not callable。coalesce(col("CurrencyDecimalPlaceNum").cast(IntegerTy
我使用pyspark,使用spark-csv将一个大型csv文件加载到dataframe中,作为预处理步骤,我需要对其中一列(包含json字符串)中的可用数据应用各种操作。这将返回X个值,每个值都需要存储在各自单独的列中。(...)
from pyspark.sql.functions import <em