我打算从挂载路径逐行读取csv文件,对每一行执行一些操作,然后将其写回一个新的csv文件。使用下面的命令读取文件,但显示找不到文件。我可以读取数据帧中的文件,但无法使用以下代码执行此操作。java.io.FileNotFoundException: /mnt/jomount/ProductDetails.csv (No such file or directory) 我还想知道我们如何在每一行上执
我有一个非常大的pyspark数据框架。我需要为每一行将数据帧转换为JSON格式的字符串,然后将该字符串发布到Kafka主题。我最初使用的是以下代码。for message in df.toJSON().collect():但是,数据帧非常大,因此在尝试collect()时会失败我在考虑使用UDF,因为它逐行处理它。from pyspar