我在我的代码中有一个问题,当我映射一个在全局图形变量上调用最短路径的函数时,我收到一个空指针异常运行时错误。出于某些原因,即使在终端中定期初始化距离不会抛出错误,而且调用testF()通常也能正常工作,但当它被映射时,它就不能工作。当我删除testF函数内部的错误距离调用时,该示例运行良好。有人知道为什么会这样吗?
val testG = Graph.fromEdges[Int, Int](sc.parallelize(List(Edge(1, 2, 1), Edge(2, 3, 1))), 0)
val testRDD = sc.parallelize(List(1, 2, 3, 4))
def testF() : Int = {
val distances = ShortestPaths.run(testG, Seq(15134567L))
return 5
}
testF() //works fine and returns 5
val testR = testRDD.map{case(num) => (num, test())}
testR.take(10).foreach(println) //gives a null pointer error发布于 2016-05-14 14:32:11
正如@DanieldePaula提到的-你不能将分布式方法嵌套在RDD中,相反,ShortestPaths.run中的逻辑需要提取并重新形成为简单的scala代码-并且没有提到sc (SparkContext)方法、SparkJob或任何其他仅限驱动程序的机制。您需要坚持使用可序列化和Worker兼容的逻辑。
https://stackoverflow.com/questions/37175738
复制相似问题