我正面临着非常奇怪的问题。我有工作流xml,它包含20个叉-连接节点,每个节点包含4-8个操作。当我提交这个工作流时,它会等待5-6分钟,然后抛出
"Error: IO_ERROR : java.net.SocketException: Connection reset"
但实际上,后台的情况是,它在10分钟后提交一个工作流,12分钟后提交另一个工作流。所以它最终触发了两次。
我尝试验证我的xml &它返回"OK“。由于它没有返回工作流,所以我无法进行调试。老实说,我不知道从哪里开始调试。
我有类似的工作流程与较小的叉子(6),他们都工作良好。但不知道为什么这件事会引起这么多麻烦。
发布于 2020-10-26 16:59:15
这些日志没有提供任何有意义的信息。所以我把我的工作流文件分成两个xml。我把第二个工作流称为第一个工作流的最后一个动作,.It工作得很好,没有任何问题。
发布于 2020-10-10 08:20:00
上面的错误看起来更像是客户端的错误。我认为检查服务器日志是个好主意。
oozie job -oozie http://localhost:11000 -info <wfid>
oozie job -oozie http://localhost:11000 -log <wfid>
您也可能使用无效的Oozie URL。例如,如果您的集群是kerberos的,则必须使用与kerberos主体匹配的Oozie URL。如果您在kerberized环境中运行,请使用Kinit和keytab (kinit user_principle -k -t key_tab
),然后在命令中使用FQN和oozie服务器名,如下所示
oozie job -oozie http://node_name@domain:11000/oozie -config xxxx -run
https://stackoverflow.com/questions/64289055
复制相似问题