如果我想使用python库来完成特定的任务,比如NLTK或BeautifulSoup,我可以在本地机器上使用Spark来完成,但是同样的事情在Spark on YARN上就不起作用了。Spark上运行,并清除Html标记。然而,当我在Spark on YARN上运行它时,它不能工作,并显示以下内容:
Fil
我在一个文件中有一个pyspark代码,让我们称它为somePythonSQL.py我正在尝试使用ojdbc.jar依赖关系将其提交给Spark,因为pyspark实际上连接到一个oracle数据库。spark-submit --master yarn somePythonSQL.py --jars "/home/ojdbc7-12.1.0.2.jar“py4j.protocol.Py4JJavaErroroccurred while cal