我正在寻找一种在PySpark中选择数据帧列的方法。对于第一行,我知道我可以使用df.first()
,但不确定列,因为它们没有列名。
我有5列,我想遍历每一列。
+--+---+---+---+---+---+---+
|_1| _2| _3| _4| _5| _6| _7|
+--+---+---+---+---+---+---+
|1 |0.0|0.0|0.0|1.0|0.0|0.0|
|2 |1.0|0.0|0.0|0.0|0.0|0.0|
|3 |0.0|0.0|1.0|0.0|0.0|0.0|
https://stackoverflow.com/questions/46813283
复制相似问题