我们如何在dataframe中的列中迭代以单独对同一数据same中的部分或所有列执行计算,而不为单个列创建不同的数据same(类似于map在rdd中遍历行,并在行上执行计算而不为每一行创建不同的rddl = list of column names
df = dataframe in pyspark</
我需要迭代pyspark.sql.dataframe.DataFrame.DataFrame的行。我以前在pandas中用iterrows()函数做过,但我需要在不使用pandas的情况下为pyspark找到类似的东西。如果我执行for row in myDF:,它将迭代columns.DataFrame
谢谢