在处理事件时,jar应用程序向任务管理器抛出异常时会发生什么?
( a) Flink作业管理器会杀死现有的任务管理器并创建一个新的任务管理器?
( b)任务管理器本身使用保存在RocksDB中的本地状态从失败的执行和重新启动过程中恢复?
java.lang.IllegalArgumentException: "Application error-stack trace"我怀疑,如果同样的错误事件被每个可用的任务管理器处理,那么它们都会被杀死,整个flink作业也会中断。
我注意到,如果出现了一些应用程序错误,那么最终整个工作都会下降。
现在还不知道确切的原因。
发布于 2019-07-30 00:12:30
通常,作业中的异常不应导致整个任务管理器下降。我们在这里讨论的是“正常”例外。在这种情况下,作业本身将失败,任务管理器将尝试重新启动它,与否取决于所提供的重新启动策略。
显然,如果由于某种原因,您的任务管理器将死亡,例如由于超时或其他原因。然后,如果您不使用某些资源管理器或编排工具,如纱线或Kubernetes,则不会自动重新启动它。在这种情况下,作业应该在有空位后开始。
至于您所描述的作业本身正在“下降”的行为,我在这里假设该作业将简单地进入FAILED状态。这是因为不同的重新启动策略对最大重试次数有不同的阈值,而且如果作业在指定的重新启动数之后无法工作,那么它只会进入失败状态。
https://stackoverflow.com/questions/57184532
复制相似问题