Linux C++ 程序占cpu%问题排查 - Go语言中文社区

Linux C++ 程序占cpu%问题排查


Linux C++ 程序占cpu%问题排查

缘起

对一个服务(room_status_server)进行了一些优化,并顺便修改了部分配置文件,重启后用top命令观察,发现该程序cpu几乎占到了100%
在这里插入图片描述

初步判断

发现这个问题后,想到前两天还上线了该服务,立马去线上看了看,还好线上是正常的。那么问题肯定是刚才的修改导致的!
把线上的版本拿过来运行,还是cpu几乎占到了100%,那很大可能是配置文件哪里改错了(后面验证表明我的猜测是对的)。

想到这是一个好的学习的机会,我想还是从运行的程序来看看到底出了什么事。

定位问题

思路:

  1. 程序占用100%的cpu,程序即进程,也就是说进程占了100%的cpu(一个核)
  2. 一个进程有多个线程,究竟是哪一个线程占了100%的cpu?
  3. 这个线程在干什么?

1. 查看程序的进程号

命令:top -c。 输入大写P,top的输出会按使用cpu多少排序。
在这里插入图片描述

PID就是进程号,我程序的进程号是4918

2. 查看耗CPU的线程号

命令:top -Hp 进程号。 同样输入大写P,top的输出会按使用cpu多少排序。

输入top -Hp 4918,展示内容如图:
在这里插入图片描述
可以看出PID是4927的线程占到了100%的cpu,我的业务日志是打印线程号的,打开日志,哦~~ 原来是这个原因(先卖个关子不说)。

3. 查看耗CPU的任务

上面找到了耗CPU的线程,那这个线程在做什么呢?
看线程在干什么,可以看线程的堆栈,命令是pstack 进程号,会输出所有线程的堆栈信息。

输入pstack 4918,并搜索线程4927的堆栈,展示内容如图:
在这里插入图片描述

从堆栈信息看,程序在执行boost创建socket监听等任务,为什么一直执行这个呢?因为,我的端口号重复使用了。

终章

其实从堆栈信息定位问题还是有些抽象的,但是大概可以看出线程在做什么,至少给排查问题指明了方向。

版权声明:本文来源CSDN,感谢博主原创文章,遵循 CC 4.0 by-sa 版权协议,转载请附上原文出处链接和本声明。
原文链接:https://blog.csdn.net/lmb1612977696/article/details/89404019
站方申明:本站部分内容来自社区用户分享,若涉及侵权,请联系站方删除。

0 条评论

请先 登录 后评论

官方社群

GO教程

猜你喜欢