进程访问外部接口的超时设置

    早上发现WEB SRV上的FCGI进程全部挂住了,查看日志才发现是访问一个外部接口的时候因为失败率比较高,导致FCGI进程都堵在接收回包上了,因为超时设了500ms,结果每个进程每秒只能处理2个请求,大量用户请求失败,所以用户不停地重试产生了滚雪球效应,后来调高进程数临时解决,后面继续梳理超时时间。

    这里给我提了个醒,在写FCGI业务处理逻辑时,必须注意以下几点:

    1. 梳理关键路径和非关键路径,在非关键路径失败的情况发生时,通过给假数据或提示的方式告知用户,但不影响正常业务逻辑。

    2. 梳理所有外部接口正常处理平均耗时和最大耗时,通常在一定时间内保证95%的请求都能正常处理就可以了,另外考虑到网络波动,可以略长一点,但对小数据包、高请求量的接口,超时最长不要超过200ms,除非是大数据包返回的情况。

    3. 但如果接口很多,比如有10个,每个接口超时都设成100ms的话,如果有几个接口有问题的话,整个业务处理逻辑最长可能要超时达500ms-1s,那进程也很有可能会挂死。所以,最好的方式是对整个业务处理有个处理时间上限,每次请求外部接口时记录耗时,请求返回后减掉耗时,一旦这个耗时减成0了,就直接返回失败,这样可以保证业务处理进程总有处理上限,不会被挂死,1s中接入能力是可评估的。

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏架构师之路

php使用tcp长连接的一种优化思路

一、面向人群 如果站点架构满足以下几点,那么本文的优化方案会非常适合: 1)使用php等脚本语言作为开发语言 2)需要连接后端服务,例如RPC服务、memcac...

3356
来自专栏九彩拼盘的叨叨叨

我理想中的前端团队需要具备的

801
来自专栏Seebug漏洞平台

MetInfo 任意文件读取漏洞的修复与绕过

404实验室内部的WAM(Web应用监控程序,文末有关于WAM的介绍)监控到 MetInfo 版本更新,并且自动diff了文件,从diff上来看,应该是修复了一...

1482
来自专栏hbbliyong

用Visual Studio Code写Node.j

介绍 vsc的宣传语是: 一个运行于 Mac OS X、Windows和 Linux 之上的,针对于编写现代 Web 和云应用的跨平台源代码编辑器。 按它说的...

38213
来自专栏极客生活

基于python flask详述 OAuth 2.0 的运作流程

OAuth2 对于我来说是一个神秘的东西,我想初步的弄懂中间的整个流程,于是就去google搜索相关的文档资料。

1534
来自专栏程序员的酒和故事

Golang中使用echo框架、MongoDB、JWT搭建REST API

生命不止,继续go go go !!! 之前介绍过golang中restful api的博客,是使用redis作为持久化,httprouter作为框架: Go...

6125
来自专栏架构师之路

无线APP时代HTTP请求DNS优化-通用

缘起:无线时代,网络稳定性差,应用流量敏感,APP与server之间每次HTTP请求都需要DNS解析,有没有优化方法呢? 一、PC时代,HTTP请求处理过程 ?...

3396
来自专栏Debian社区

bmon:一个强大的网络带宽监视和调试工具

bmon 是类 Unix 系统中一个基于文本,简单但非常强大的 网络监视和调试工具,它能抓取网络相关统计信息并把它们以用户友好的格式展现出来。它是一个可靠高效的...

1293
来自专栏IMWeb前端团队

分享几个便利的工具软件

clover 官方网址:http://cn.ejie.me/ 方便的 Tab 页功能 要掌握功能强大,操作简单的标签页,只需记住Ctrl+T新开页面,Ctrl+...

1886
来自专栏我是攻城师

从App的角度看进程和线程

在现在人人都有一部手机或电脑的年代,我们几乎天天都在使用各种app,如微信,QQ,抖音,优酷等等软件,表面上我们是与各种app交互,但如果站在操作系统的角度来看...

552

扫码关注云+社区