我们注意到了我们的presto集群(安装在Linux机器上的presto )中的以下奇怪行为
我们有9台自动售货机,
从预置仪表板上我们可以看到,有些时候有7-8活动的工人,有些时候所有的预置工人- 9
这是正常行为吗?
从预售工人的原木上,我看不到一些不寻常的东西
我不确定我们是否需要搜索任何网络问题或其他问题?

注意-当我重新启动所有的预售工人,然后重新启动后,预售工人在仪表板上是稳定的,但是在5-10小时之后,我们再次得到了奇怪的行为,我们对这种情况无能为力,
Note1 --我们检查presto二进制文件是否意外地重新启动--但事实并非如此,所有的预置工作器二进制文件都是稳定的。
./launcher status
Running as 22815另外我要说的是普雷斯托仪表盘上没有显示哪一位预售工人是下岗的,所以很难搞清楚哪一位是“坏”的预售工人,
*在预置协调员日志中-我们可以看到如下消息:
- but not sure this are related to our issues?
WARN http-client-memoryManager-scheduler com.facebook.presto.memory.RemoteNodeMemory Error fetching memory info from http://105.14.25.4:1010/v1/memory: java.util.concurrent.TimeoutException: Total timeout 10000 ms elapsed发布于 2019-08-09 09:27:31
对于我的问题给你带来的不便,我深表歉意
实际上这是我的错误,我会解释的
在这个presto集群中,我们有9名员工。
,但我忘记从其他集群中删除相同主机名的工作人员。
因此,这种行为是因为3个重复的主机名( presto工作者)
移除重复的presto工作人员后,presto现在非常稳定。
https://stackoverflow.com/questions/57418668
复制相似问题