首页
学习
活动
专区
圈层
工具
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

架构设计中两个重要指标,延时与吞吐量(架构师之路:第3讲)

《架构师之路:架构设计中的100个知识点》

3.延时与吞吐量

架构优化时,什么时候要重点优化延时,什么时候要重点优化吞吐量?

画外音:补充阅读材料在最后。

延时(Latency)吞吐量(Throughput)是架构设计中非常重要,又非常容易搞混的两个指标。

什么是延时?

延时是指完成某个动作所需要的时间。

返回一个HTTP请求的时间是200毫秒,我们说请求的延时是200毫秒。

生一个孩子的时间是10个月,我们说生孩子延时是10个月。

什么是吞吐量?

吞吐量是指单位时间内完成某个动作的次数。

一个请求的处理时间是200毫秒,单线程每秒钟可以处理5个请求,我们就说其的吞吐量是每秒5次。

10个月能生一个孩子,我们就说生孩子的吞吐量是每10月1个。

延时和吞吐量有什么关系?

一般来说,降低延时可以提升吞吐量。

例如:200毫秒处理一个请求,优化为100毫秒处理一个请求,吞吐量就由5提升为10了。

但是,不降低延时也可以提升吞吐量。

例如:单线程200毫秒处理一个请求,线程数增加到10,吞吐量就由5提升为50了。

画外音:假如CPU不是瓶颈。

有时候,延时是很难降低,此时不能靠降低延时增加吞吐量。

例如:生孩子的延时就必须是10个月。

此时,提升吞吐量的方法只能多个家庭并发一起生。

回到开篇的问题,架构优化时,什么时候要重点优化延时,什么时候要重点优化吞吐量?

对于大规模系统的架构设计而言:

延时,延时更多是性能(performance)指标,关乎单用户体验。

吞吐量,吞吐量是扩展性(scalability)指标,关乎同时能服务多少客户。

系统的性能,是有天花板的,延时不能无限优化,不可能降到0。

系统的扩展性,理论上是无限的,架构合理的话,吞吐量可以无限提升,能同时为无限多的用户同时服务。

一句话来回答这个问题:

一个用户慢,就去优化延时。

多个用户扛不住,就去优化吞吐量。

补充阅读材料

《延时与吞吐量》

https://cs.fyi/guide/latency-vs-throughput

分为几部分:

1. 延时

2. 吞吐量

3. 延时与吞吐量的关系

4. Web Server举例

5. Database举例

6. 总结

文章不长,10分钟能读完。

希望大家有收获。

  • 发表于:
  • 原文链接https://page.om.qq.com/page/OR4dxne61PxxzYfUl-yR9zZw0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券