每次运行mysqldump或表优化时,Galera集群似乎都会死锁。
我在我的MariaDB 10.1数据库服务器上运行了几次"mysqlcheck“和"mysqldump”。(它与另外两个服务器一起运行在Galera集群中)
我已经注意到,这两个任务停止,没有显示出任何进展后运行了一小段时间。
例如,mysqldump在创建一个14,0MB (14.760.912字节)转储文件后停止,并且不继续。
用于修复和优化表的mysqlcheck也挂起。
在这两种情况下,集群开始出现问题,使其正常工作的唯一方法是使执行作业的服务器脱机,并使另一台服务器脱机。然后,我把它们重新放到一个网络上,集群再次正常工作。
我不知道是什么导致了这些问题。我在syslog中没有发现任何错误,尽管在服务器关闭期间,我注意到以下几点:
1月10日20:43:46法国mysqld1015:2016-01-10 20:43:46 140096330258176 警告 WSREP:隔离失败: 3,模式: mysql,sql:优化表proc
。检查状态并重试查询。
1月10日21:58:47法国mysqld1034:2016-01-10 21:58:47 139691511322368 警告 WSREP:隔离失败: 3,模式: smf,sql:优化表smf_categories
。检查状态并重试查询。1月10日21:58:47法国mysqld1034:2016-01-10 21:58:47 139691511322368 警告中止连接到db:'smf‘用户:’smf‘用户:'localhost’主机:‘localhost’(未知错误)1月10日:58:47法国mysqld1034:2016-01-10 21:58:47 139691509827328 警告 WSREP: TO隔离失败: 3,schema:(null),sql:从mysql.user限制1选择1。检查wsrep状态并重试查询。
我发现问题出在Galera身上。当我将服务器从集群中取出时,优化和转储作业运行得更快,并正确地完成。
发布于 2016-01-12 13:24:34
我在MariaDB KB:https://mariadb.com/kb/en/mariadb/galera-cluster-fail-during-dump-or-optimize/#comment_1911年上被汤姆指出了正确的方向
这个问题似乎是由流量控制引起的。我已经通过调优流控制设置来解决这个问题。
为此,我添加了以下wsrep_provider_options: gcs.fc_limit=500;gcs.fc_master_slave=YES;gcs.fc_factor=1.0
然而,它也产生了一个新的问题,作业现在正确地完成了,但是在那之后,集群仍然关闭。
https://serverfault.com/questions/748087
复制相似问题