我使用以下命令用一堆包含2个字符串"filename“、"content”的数组填充RDD。
现在,我想遍历所有这些事件,对每个文件名和内容做一些处理。
val someRDD = sc.wholeTextFiles("hdfs://localhost:8020/user/cloudera/*")
然而,我似乎找不到任何关于如何做到这一点的文档。
所以我想要的是:
foreach occurrence-in-the-rdd{
//do stuff with the array found on loccation n of the RDD
}
https://stackoverflow.com/questions/25914789
复制相似问题