如何通过 Java 线程堆栈来进行性能瓶颈分析?

改善性能意味着用更少的资源做更多的事情。为了利用并发来提高系统性能,我们需要更有效的利用现有的处理器资源,这意味着我们期望使 CPU 尽可能出于忙碌状态(当然,并不是让 CPU 周期出于应付无用计算,而是让 CPU 做有用的事情而忙)。如果程序受限于当前的 CPU 计算能力,那么我们通过增加更多的处理器或者通过集群就能提高总的性能。总的来说,性能提高,需要且仅需要解决当前的受限资源,当前受限资源可能是:

CPU: 如果当前 CPU 已经能够接近 100% 的利用率,并且代码业务逻辑无法再简化,那么说明该系统的性能以及达到上线,只有通过增加处理器来提高性能其他资源:比如连接数等。可以修改代码,尽量利用 CPU,可以获得极大的性能提升

如果你的系统有如下的特点,说明系统存在性能瓶颈:

随着系统逐步增加压力,CPU 使用率无法趋近 100%(如下图)

持续运行缓慢。时常发现应用程序运行缓慢。通过改变环境因子(负载,连接数等)也无法有效提升整体响应时间

系统性能随时间的增加逐渐下降。在负载稳定的情况下,系统运行时间越长速度越慢。可能是由于超出某个阈值范围,系统运行频繁出错从而导致系统死锁或崩溃系统性能随负载的增加而逐渐下降。

一个好的程序,应该是能够充分利用 CPU 的。如果一个程序在单 CPU 的机器上无论多大压力都不能使 CPU 使用率接近 100%,说明这个程序设计有问题。一个系统的性能瓶颈分析过程大致如下:

先进性单流程的性能瓶颈分析,受限让单流程的性能达到最优。进行整体性能瓶颈分析。因为单流程性能最优,不一定整个系统性能最优。在多线程场合下,锁争用㩐给也会导致性能下降。

高性能在不同的应用场合下,有不同的含义:

有的场合高性能意味着用户速度的体验,如界面操作等有的场合,高吞吐量意味着高性能,如短信或者彩信,系统更看重吞吐量,而对每一个消息的处理时间不敏感有的场合,是二者的结合

性能调优的终极目标是:系统的 CPU 利用率接近 100%,如果 CPU 没有被充分利用,那么有如下几个可能:

施加的压力不足系统存在瓶颈

1 常见的性能瓶颈

1.1 由于不恰当的同步导致的资源争用

1.1.1 不相关的两个函数,公用了一个锁,或者不同的共享变量共用了同一个锁,无谓地制造出了资源争用

下面是一种常见的错误

上面的代码将 synchronized 加在类的每一个方法上面,违背了保护什么锁什么的原则。对于无共享资源的方法,使用了同一个锁,人为造成了不必要的等待。Java 缺省提供了 this 锁,这样很多人喜欢直接在方法上使用 synchronized 加锁,很多情况下这样做是不恰当的,如果不考虑清楚就这样做,很容易造成锁粒度过大:

两个不相干的方法(没有使用同一个共享变量),共用了 this 锁,导致人为的资源竞争即使一个方法中的代码也不是处处需要锁保护的。如果整个方法使用了 synchronized,那么很可能就把 synchronized 的作用域给人为扩大了。在方法级别上加锁,是一种粗犷的锁使用习惯。

上面的代码应该变成下面

1.1.2 锁的粒度过大,对共享资源访问完成后,没有将后续的代码放在synchronized 同步代码块之外

这样会导致当前线程占用锁的时间过长,其他需要锁的线程只能等待,最终导致性能受到极大影响

上面的代码,会导致一个线程长时间占有锁,而在这么长的时间里其他线程只能等待,这种写法在不同的场合下有不同的提升余地:

单 CPU 场合 将耗时操作拿到同步块之外,有的情况下可以提升性能,有的场合则不能:同步块的耗时代码是 CPU 密集型代码(纯 CPU 运算等),不存在磁盘 IO/网络 IO 等低 CPU 消耗的代码,这种情况下,由于 CPU 执行这段代码是 100% 的使用率,因此缩小同步块也不会带来任何性能上的提升。但是,同时缩小同步块也不会带来性能上的下降同步块中的耗时代码属于磁盘/网络 IO等低 CPU 消耗的代码,当当前线程正在执行不消耗 CPU 的代码时,这时候 CPU 是空闲的,如果此时让 CPU 忙起来,可以带来整体性能上的提升,所以在这种场景下,将耗时操作的代码放在同步之外,肯定是可以提高整个性能的(?)多 CPU 场合 将耗时的操作拿到同步块之外,总是可以提升性能同步块的耗时代码是 CPU 密集型代码(纯 CPU 运算等),不存在磁盘 IO/网络 IO 等低 CPU 消耗的代码,这种情况下,由于是多 CPU,其他 CPU也许是空闲的,因此缩小同步块可以让其他线程马上得到执行这段代码,可以带来性能的提升同步块中的耗时代码属于磁盘/网络 IO等低 CPU 消耗的代码,当当前线程正在执行不消耗 CPU 的代码时,这时候总有 CPU 是空闲的,如果此时让 CPU 忙起来,可以带来整体性能上的提升,所以在这种场景下,将耗时操作的代码放在同步块之外,肯定是可以提高整个性能的

不管如何,缩小同步范围,对系统没有任何不好的影响,大多数情况下,会带来性能的提升,所以一定要缩小同步范围,因此上面的代码应该改为

1.1.3 其他问题

Sleep 的滥用,尤其是轮询中使用 sleep,会让用户明显感觉到延迟,可以修改为 notify 和 waitString + 的滥用,每次 + 都会产生一个临时对象,并有数据的拷贝不恰当的线程模型效率地下的 SQL 语句或者不恰当的数据库设计不恰当的 GC 参数设置导致的性能低下线程数量不足内存泄漏导致的频繁 GC

2.2 性能瓶颈分析的手段和工具

上面提到的这些原因形成的性能瓶颈,都可以通过线程堆栈分析,找到根本原因。

2.2.1 如何去模拟,发现性能瓶颈

性能瓶颈的几个特征:

当前的性能瓶颈只有一处,只有当解决了这一处,才知道下一处。没有解决当前性能瓶颈,下一处性能瓶颈是不会出现的。如下图所示,第二段是瓶颈,解决第二段的瓶颈后,第一段就变成了瓶颈,如此反复找到所有的性能瓶颈

性能瓶颈是动态的,低负载下不是瓶颈的地方,高负载下可能成为瓶颈。由于 JProfile 等性能剖析工具依附在 JVM 上带来的开销,使系统根本就无法达到该瓶颈出现时需要的性能,因此在这种场景下线程堆栈分析才是一个真正有效的方法

鉴于性能瓶颈的以上特点,进行性能模拟的时候,一定要使用比系统当前稍高的压力下进行模拟,否则性能瓶颈不会出现。具体步骤如下:

2.2.2 如何通过线程堆栈识别性能瓶颈

通过线程堆栈,可以很容易的识别多线程场合下高负载的时候才会出现的性能瓶颈。一旦一个系统出现性能瓶颈,最重要的就是识别性能瓶颈,然后根据识别的性能瓶颈进行修改。一般多线程系统,先按照线程的功能进行归类(组),把执行相同功能代码的线程作为一组进行分析。当使用堆栈进行分析的时候,以这一组线程进行统计学分析。如果一个线程池为不同的功能代码服务,那么将整个线程池的线程作为一组进行分析即可。

一般一个系统一旦出现性能瓶颈,从堆栈上分析,有如下三种最为典型的堆栈特征:

绝大多数线程的堆栈都表现为在同一个调用上下文,且只剩下非常少的空闲线程。可能的原因如下:线程的数量过少锁的粒度过大导致的锁竞争资源竞争锁范围中有大量耗时操作远程通信的对方处理缓慢绝大多数线程出于等待状态,只有几个工作的线程,总体性能上不去。可能的原因是,系统存在关键路径,关键路径已经达到瓶颈线程总的数量很少(有些线程池的实现是按需创建线程,可能程序中创建线程

一个例子

从堆栈看,有 51 个(socket)访问,其中有 50 个是 JDBC 数据库访问。其他方法被阻塞在 java.lang.Object.wait() 方法上。

2.2.3 其他提高性能的方法

减少锁的粒度,比如 ConcurrentHashMap 的实现默认使用 16 个锁的 Array(有一个副作用:锁整个容器会很费力,可以添加一个全局锁)

2.2.4 性能调优的终结条件

性能调优总有一个终止条件,如果系统满足如下两个条件,即可终止:

算法足够优化没有线程/资源的使用不当而导致的 CPU 利用不足

如果你也想学习这一套系统化的课程体系,那么我向你们推荐一个交流学习群:697579751 里面会分享一些资深架构师录制的视频录像:有Spring,MyBatis,Netty源码分析,高并发、高性能、分布式、微服务架构的原理,JVM性能优化这些成为架构师必备的知识体系。还能领取免费的学习资源,目前受益良多,以下的课程体系图也是在群里获取。群:697579751

大家可以关注我,私信发送‘架构’即可获取以下资料,里面有源码分析、性能优化、微服务架构、工程化、分布式等知识点。走的就是高端路线 下图是资料的一部分知识点 有用没用一看就知道的:

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏Vue ssr

php,vue,vue-ssr 三版本页面对比Demo

目前我这边的web页面,都是采用php+smarty模板生成的,是一种比较早期的开发模式。好处是没有现阶段常用的前后端分离出现的首屏问题,因为其本身就是服务器渲...

2110
来自专栏hotqin888的专栏

HydroCMS水利设计管理系统,基于beego框架

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/hotqin888/article/det...

942
来自专栏智能算法

一文看懂npm、yarn、pnpm之间的区别

原文:Understanding differences between npm, yarn and pnpm 作者:Alex Kras 翻译:雁惊寒 本文作者...

32010
来自专栏风中追风

分布式基础_All-In-One到SOA的分布式架构演进

在诞生之初始,应用与数据库是部署在同一台机器上,这时的用户量、数据量规模都比较小,这样的架构既简单实用、便于维护,成本又低,成为了这个时代的主流架构方式。随着用...

3629
来自专栏杨建荣的学习笔记

运维平台中的脚本管理

截止目前,元数据的工作完成了一些阶段性的内容,当然还有非常多的需要细化的东西,从优先级层面来说,可以暂时放一放。 现在迫切需要的是一些能用起来的功能,比如结合业...

3845
来自专栏云计算

微服务的模式 - 同步与异步

微服务是一种架构范例。在这种架构中,多个小型独立组件协同工作,从而构成一个系统。尽管它的操作复杂性较高,但这种范式已经被迅速采用。这是因为它有助于...

8073

物联网,数据库系统和数据分发,第二部分

在这个由两部分组成的系列文章的第一部分中,我介绍了物联网中需要收集数据的位置:公共云或私有云中的边缘设备,网关和服务器。我还讨论了这些系统的特点以及选择合适的数...

3504
来自专栏韩伟的专栏

分布式本质论:高吞吐、高可用、可扩展

大量用户访问同一个互联网业务,所造成的问题并不简单。从表面上看,要能满足很多用户来自互联网的请求,最基本的需求就是所谓性能需求:用户反应网页打开很慢,或者网游中...

1.6K0
来自专栏Python数据科学

33款你可能不知道的开源爬虫软件工具

爬虫,即网络爬虫,是一种自动获取网页内容的程序。是搜索引擎的重要组成部分,因此搜索引擎优化很大程度上就是针对爬虫而做出的优化。

1782
来自专栏技术翻译

共享MongoDB主机的五大好处

共享主机是在云中部署MongoDB的最具成本效益且易于设置的选项之一,并被全球数千家公司用于托管其数据库。在这篇文章中,我们概述了使用共享MongoDB主机的五...

1090

扫码关注云+社区