前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >java 一次CPU占用过高问题的排查及解决

java 一次CPU占用过高问题的排查及解决

作者头像
江湖前辈黄药师
发布2018-08-27 14:34:59
7780
发布2018-08-27 14:34:59
举报
文章被收录于专栏:博客园迁移博客园迁移

最近一段时间  某台服务器上的一个应用总是隔一段时间就自己挂掉      用top看了看  从重新部署应用开始没有多长时间CPU占用上升得很快  

排查步骤

1.使用top 定位到占用CPU高的进程PID

  top 

2.通过ps aux | grep PID命令

  获取线程信息,并找到占用CPU高的线程

  ps -mp pid -o THREAD,tid,time | sort -rn 

3.将需要的线程ID转换为16进制格式

  printf "%x\n" tid

4.打印线程的堆栈信息  到了这一步具体看堆栈的日志来定位问题了

  jstack pid |grep tid -A 30

----------------------------------------------------------------------------  华丽的分割线  ------------------------------------------------------------------------------------------------------------------

top     可以看出PID  733进程 的占用CPU  172%

查找进程733下的线程  可以看到TID 线程775占用了96%且持有了很长时间  其实到这一步基本上能猜测到应该是    肯定是那段代码发生了死循环

ps -mp 733 -o THREAD,tid,time | sort -rn

线程ID转换为16进制格式

printf "%x\n" 775

 查看java  的堆栈信息

jstack 733 |grep 307 -A 30

显然是 SmsQueueServiceImpl 中的produceMissSms   和 consumeMissSms  方法有问题

一下为精简的部分代码

/**
 * Created by dongxc on 2015/7/7. 通知消息队列
 */

从很有年代感的垃圾代码来看  这两个方法并没有什么问题  继续往调用这两个方法的上层排查

/**
 * Created by dongxc on 2015/7/7.
 * 消息通知监控线程
 */
@Service("smsMonitorComsumer")
public class SmsMonitorComsumerImpl {

    @Autowired
    private SmsQueueServiceImpl smsQueueService;
    
    //取队列里的任务消费
    @Transactional(propagation= Propagation.NOT_SUPPORTED)
    public void run() {

    while (true) {
            try {
                SmsLogDo smsLogDo = smsQueueService.consumeMissSms();
                Boolean result = false;
                if(smsLogDo!=null){
                    long diff = (new Date()).getTime() - smsLogDo.getSendtime().getTime() ;
                    long min  = diff%(1000*24*60*60)%(1000*60*60)/(1000*60);//计算差多少分钟
                    if(min>5){
                        result = true;
                    }
                }
                if(result){
                    smsQueueService.produceSms(smsLogDo);
                }else{
                    smsQueueService.produceMissSms(smsLogDo);
                }
            } catch (Exception ex) {
                try{
                    Thread.sleep(3000);
                }catch(Exception e){
                    //logger.error("发送站内信息短信时线程执行失败2!", e);
                }
            }
        }



    }
}

很显然  这里有一个while(true)  无数个草泥马策马奔腾           ps:垃圾代码看多了, 我已经不愤怒了. 

 基本定位到问题了      while里面完全是没有用的代码

继续往上层看谁来调用

/**
 * Created by dongxc on 2015/7/7.
 * 通知消息队列
 */
@Service("smsLogRunThread")
public class SmsLogRunThreadImpl {
    public int flag;
    @Autowired
    private SmsLogConsumerImpl smsLogConsumer;
    @Autowired
    private SmsMonitorComsumerImpl smsMonitorComsumer;

    @PostConstruct
    public void init() {
        
        
        if(ip!=""&&host!=""&&ip.equals(host)){
            Thread thread = new Thread(){
                public void run() {
                    smsLogConsumer.run();
                }
            };
            thread.start();
            Thread thread1 = new Thread(){
                public void run() {
                    smsMonitorComsumer.run();
                }
            };
            thread1.start();
        }

        
    }
}

在应用一启动的时候   spring初始化的就会执行这一段处理丢失消息的代码   然后这段死循环代码  没有任何作用    

解决方法   即   注释掉whlie(true)这一段代码

 重新部署后 cpu占用就很正常了

案例一下,其实之前也遇到过CPU占用很高的问题,  但是那次是  频繁的GC导致的

其实排查问题 的过程中也是在不断的学习的过程 ! 先打个鸡血,我要继续搬砖了

本文参与 腾讯云自媒体分享计划,分享自作者个人站点/博客。
原始发表:2018-08-09 ,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档