前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >php-fpm平滑重启为什么不平滑(process_control_timeout)

php-fpm平滑重启为什么不平滑(process_control_timeout)

作者头像
用户2825413
发布2019-07-16 11:02:37
2.1K0
发布2019-07-16 11:02:37
举报

线上不出点问题, 似乎今天就不是周五了.

突然报警群里出现了某一条数据, 反馈没有上报成功, 中间流程执行完, 后面没再执行了(细思极恐)

无语。。。

想了想刚才有发版, 但是不是这个引起的还不确定 (我们目前没有灰度发布-_-)

1. 从日志中丰富问题信息

首先我得确定下这条数据的到达时间, error日志查, 查看业务日志是否有过重要的打点信息, 通过从access日志里面, 定位到这条问题数据请求时间为 10:22:42

2. 10:22 我们做了什么?

通过查看聊天记录,10点多有个上线操作, 并且别的项目之前一上线就抱怨说可能就会有502出现, 由此我想我们发布服务中间可能操作了什么出现的问题

嗯。。万事不求人, 看下php-fpm的日志就知道啥时候上过线了(我们构建项目会重启fpm).

发现php-fpm.log文件内容:

代码语言:javascript
复制
[19-Apr-2019 10:22:42] NOTICE: Reloading in progress ...
[19-Apr-2019 10:22:42] NOTICE: reloading: execvp("/usr/local/php-fpm_9000/sbin/php-fpm", {"/usr/local/php-fp
m_9000/sbin/php-fpm", "--daemonize", "--fpm-config", "/usr/local/php-fpm_9000/etc/php-fpm.conf", "--pid", "/
usr/local/php-fpm_9000/var/run/php-fpm.pid"})
[19-Apr-2019 10:22:42] NOTICE: [pool www] 'user' directive is ignored when FPM is not running as root
[19-Apr-2019 10:22:42] NOTICE: [pool www] 'user' directive is ignored when FPM is not running as root
[19-Apr-2019 10:22:42] NOTICE: [pool www] 'group' directive is ignored when FPM is not running as root
[19-Apr-2019 10:22:42] NOTICE: [pool www] 'group' directive is ignored when FPM is not running as root
[19-Apr-2019 10:22:42] NOTICE: using inherited socket fd=8, "127.0.0.1:9000"
[19-Apr-2019 10:22:42] NOTICE: using inherited socket fd=8, "127.0.0.1:9000"
[19-Apr-2019 10:22:42] NOTICE: fpm is running, pid 23324
[19-Apr-2019 10:22:42] NOTICE: ready to handle connections

nginx错误:

代码语言:javascript
复制
 [error] 66#0: *10 recv() failed (104: Connection reset by peer) while reading response header from upstream

这个错误很熟悉吧,之前文章已经介绍过了.

3. 先下个结论,顺着这个想想

发布服务重启php-fpm, 导致的代码流程执行中断.

4. 等等, 应该是平滑重启,怎么会中断?

首先思考中断可能的原因:

  1. 代码某个点执行时间过长,timeout
  2. 资源不够,比如内存溢出中断
  3. 代码bug、异常
  4. 服务器断电
  5. ….

这些问题应该不会, 这个被中断的服务 没有依赖的服务请求, 也没有复杂的业务逻辑.(不要问为啥没问题,因为这是我写的+_+)

5. 平滑重启为什么不平滑?

借助着搜索引擎的力量, 找问题就变得傻瓜起来

  1. 记 php-fpm 重启导致的 程序执行中断问题 https://yq.aliyun.com/articles/226970
  2. 重启php-fpm时请求发生502错误的原因及解决:process_control_timeout http://www.04007.cn/article/439.html
  3. PHP-FPM参数 https://www.jianshu.com/p/795a1a181aa7
  4. Graceful Restart (USR2) isn't very graceful https://bugs.php.net/bug.php?id=60961

最后详细的读了下最后一篇向官方反馈的bug, php-fpm的平滑重启不平滑

其中目前建议:

代码语言:javascript
复制
[2013-02-13 15:57 UTC] phpbugs at oops dot mooo dot com
Try setting process_control_timeout to something higher than 0.
process_control_timeout 参数解释

参数含义是 设置子进程接受主进程复用信号的超时时间. 控制子进程处理来自master的信号的时间,默认为0.如果正在处理请求, 很可能会收到错误报警。建议将此参数设置为相同的值 request_terminate_timeout,以便worker有时间完成处理请求, 否则将会中断。

验证

代码语言:javascript
复制
<?php
  echo 1;
  sleep(10);
  echo 3;

访问中, 进行 kill -USR2 10 报错:

将 php-fpm.conf 的 process_control_timeout 配置为20

进行 kill -USR2 11

正常输出结果.

结论

后续是否有副作用还需要在生产环境验证

服务发布优化也不仅于此

为什么要每次重启fpm

比如能不能用其他方式使缓存失效呢?

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2019-04-19,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 呆呆熊的技术路 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 1. 从日志中丰富问题信息
  • 2. 10:22 我们做了什么?
  • 3. 先下个结论,顺着这个想想
  • 4. 等等, 应该是平滑重启,怎么会中断?
  • 5. 平滑重启为什么不平滑?
    • process_control_timeout 参数解释
    • 验证
    • 结论
    领券
    问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档