我已经成功地运行了Hue Oozie工作流编辑器(在Cloudera5.5.1 QuickStart VM中)中提供的示例Spark工作流(“通过启动Spark程序复制文件”)。
我现在尝试使用oozie
命令行工具手动运行它:
oozie job -oozie http://localhost:11000/oozie -config job.properties -run
工作流XML基本不变--我已将其复制到HDFS,并具有以下job.properties
nameNode=hdfs://localhost:8020
jobTracker=localhost:8032
oozie.wf.application.path=/user/cloudera/workflows/spark-scala/spark-scala.xml
input=/user/hue/oozie/workspaces/data/sonnets.txt
output=here
该作业被接受,并出现在Hue web仪表板中,但几秒钟后就会被终止,日志报告:
启动程序异常: java.lang.ClassNotFoundException:未找到类org.apache.oozie.action.hadoop.SparkMain
这里有什么问题?
发布于 2016-05-24 02:25:10
默认情况下,Oozie不包括火花操作的库--您需要在job.properties
中添加以下内容
oozie.use.system.libpath=true
(单击Hue仪表板中先前成功的Hue工作流,您可以选择Configuration选项卡来查看Hue提供的属性)
https://stackoverflow.com/questions/37410831
复制相似问题