在PySpark中,我们不能使用传统的熊猫或R风格的符号来根据DataFrame中的旧列来制作新的列。例如,假设我试图连接两列:df['newcol'] = F.concat(df['col_1'], df['col_2'])
结果:TypeError: 'DataFrame' object does n
我发现PySpark有一个名为drop的方法,但它似乎一次只能删除一列。关于如何同时删除多个列有什么想法吗?selectedMachineView = machineView.drop([['GpuName','GPU1_TwoPartHwID']])
/usr/hdp/current/spark-client/python/pyspark/sql/dataframe.pyc in d