Linux问题排查 —CPU - Go语言中文社区

社区微信群开通啦，扫一扫抢先加入社区官方微信群

社区微信群

Linux问题排查 —CPU - Go语言中文社区

文章 (current)
Go面试题热
Go导航
Go教程
官方文档

登录
注册

Linux问题排查 —CPU

linux

Linux问题排查 —CPU

前言

在当今Docker等容器大行其道的年代，多数互联网公司的线上服务器都是使用Linux。当我们的服务部署在Linux上并出现问题时，都指望运维同学来排查是不切实际的，因此程序员必须具备一定的问题排查能力。

但是，大多数程序员并不清楚要如何排查常见的Linux线上问题。当然，能直接从业务系统的日志中得知问题所在，那还比较好办，但是如果遇到CPU高、内存高、IO高、网络问题等，很多人就会无从下手。

因此，笔者总结了一些常见线上问题排查的经验与大家分享。

总体排查思路

对于CPU高，我们首先分为两种情况分析，一种是用户CPU高，另外一种是系统CPU高。用户CPU高通常是用户程序消耗了较多的CPU，如：程序的死循环、大量的CAS操作等。

而内核CPU高则是系统方法消耗了较多的CPU，如：上下文切换、页切换等。但归根到底，系统不会自己无缘无故出现这些情况，最终还是应用程序的系统调用等因素导致的。

Linux内核目前有300多个系统调用。这些系统调用主要分为几类：

文件和设备访问类比如open/close/read/write/chmod等

进程管理类 fork/clone/execve/exit/getpid等

信号类 signal/sigaction/kill 等

内存管理 brk/mmap/mlock等

进程间通信IPC shmget/semget 信号量，共享内存等

网络通信 socket/connect/sendto/sendmsg 等

其他

首先，我们通过top命令确定是用户CPU高还是系统CPU高，并且能找到CPU最高的进程PID。

如果是用户CPU高，我们会分为Java应用导致的高CPU和库函数调用导致的高CPU两种情况，并分别排查。

如果是系统CPU高，我们则直接确定是哪些系统调用导致的，并追踪对应的程序。

下面来看一个例子，我们可以使用top命令来查看用户CPU和系统CPU的使用百分比：

很明显，用户程序使用了50.6%的CPU，并且占用CPU最高的是一个java进程。

用户CPU高

对于用户CPU高，我们分别介绍Java应用导致和库函数调用导致两种情况下的问题排查。我们先使用上一小节的场景，排查Java应用CPU高的原因。

Java程序CPU高

我们已经从top命令中得知，导致用户CPU高的java应用PID是23517。但是这是不够的，我们还需要知道具体是什么代码导致的高CPU。因此，我们使用命令：top -Hp 23517，列出进程中线程CPU的使用统计。

我们可以看到，占用CPU最高的线程PID是23518。然后，我们把这个PID转换为16进制，得到5bde。

接着，我们输入命令jstack 23517 | grep -C 50 5bde查看具体是哪个线程占用了这么多的CPU。

我们可以看到，在Test类的main方法中，第11行的代码造成了CPU高。

当然有时候我们会追踪到由于GC线程导致的高CPU，此时就需要再进行内存方面的诊断了。

库函数调用CPU高

当我们的程序频繁调用系统库函数，也会导致用户CPU高，此时我们可以使用ltrace 来跟踪进程调用库函数的情况，以下是比较常用的命令参数。

ltrace —— library call tracer

-T显示每一调用所耗的时间.

-f 跟踪由fork调用所产生的子进程.

-p 绑定一个由PID对应的进程.

-c 统计每一系统调用的所执行的时间,次数和出错的次数等.

-d 输出strace关于标准错误的调试信息.

-l 只打印某个库中的调用

-o 把输出定向到文件

…

以使用了-Tfp参数为例，最左边是PID，然后是被调用的系统函数库，右边是返回的结果和对应的耗时。

当分析出耗时最多的系统库函数时，就能很容易定位到是什么代码造成的CPU高。

内核CPU高

内核CPU高是由于系统方法消耗了较多的CPU，因此我们可以使用strace，跟踪进程的系统调用或信号产生的情况，用来确定内核CPU。

因为Linux进程不能直接去访问硬件设备，如：读取磁盘文件、接收网络数据等，但可以通过系统调用来实现。这时strace就可以跟踪到一个进程产生的系统调用，包括参数，返回值，执行消耗的时间、调用次数，成功和失败的次数。

strace和ltrace的使用方式非常相似，因此就不再赘述。

如果是因为中断导致的CPU高，可以使用cat /proc/interrupts查看每个CPU被中断的次数统计。

总结

这次我们介绍了在Linux系统中的CPU问题诊断。后面我们会继续介绍内存、IO、网络等方面的诊断方法。

欢迎关注我们公众号

欢迎加入我们的知识星球，一起讨论技术问题

版权声明：本文来源CSDN，感谢博主原创文章，遵循 CC 4.0 by-sa 版权协议，转载请附上原文出处链接和本声明。
原文链接：https://blog.csdn.net/a315157973/article/details/102876851
站方申明：本站部分内容来自社区用户分享，若涉及侵权，请联系站方删除。

发表于 2021-05-16 21:24:38

分类：Linux

你可能感兴趣的文章

Linux下编译安装PHP7.3.1 1574 浏览
Docker在Windows和Linux安装以及常用命令 1536 浏览
『中级篇』在linux/mac下通过Docker-Machine在阿里云上的使用（11） 1577 浏览
在Windows和Linux上编译gRPC源码操作步骤(C++) 1670 浏览
linux c++开发记录 1499 浏览
linux下/var/run目录下.pid文件的作用 1470 浏览
linux下tensorflow安装 1204 浏览
在Linux服务器上配置tensorflow-gpu版（最详细教程） 1642 浏览
linux内存管理--linux内核高端内存 1281 浏览

精选的优质文章

也许 Go 开发可以更简单！ 10580 浏览
如何使用 Golang 日志监控你的应用程序？ 12054 浏览
从Go语言实现模板设计模式浅谈Go的抽象能力 14103 浏览
阿里云基于 Go 的微服务架构分享 23968 浏览
java是否会被取代？Go会否给Java带来冲击？ 28491 浏览
千万级规模高性能、高并发的网络架构经验分享 30048 浏览
阿里部分面试题汇总,对想进阿里的同学非常实用 62344 浏览
实用好文：知乎实时数仓架构实践及演进 31364 浏览
支撑马蜂窝「双11」营销大战背后的技术架构 228307 浏览
想进大厂？50个多线程面试题，你会多少？（一） 23104 浏览

0 条评论

请先登录后评论

官方社群

关注公众号
—— 加入社区微信群 ——
→「Go语言教程」领取

GO教程

1.1 Go语言简介
1.2 Go语言的特性
1.3 Go语言为并发而生
1.4 哪些项目使用Go语言开发？
1.5 哪些大公司正在使用Go语言
1.6 Go语言的性能如何？
1.7 Go语言标准库强大
1.8 Go语言上手简单
1.9 Go语言代码风格清晰、简单
1.10 Go语言工程结构详述
1.11 第一个Go语言程序
1.12 Go语言历史版本

2.1 Go语言变量的声明
2.2 Go语言变量的初始化
2.3 Go语言多个变量同时赋值
2.4 Go语言匿名变量
2.5 Go语言变量的作用域
2.6 Go语言整型（整数类型）
2.7 Go语言浮点类型（小数类型）
2.8 Go语言复数
2.9 Go语言bool类型（布尔类型）
2.10 Go语言字符串
2.11 Go语言字符类型（byte和rune）
2.12 Go语言数据类型转换
2.13 Go语言指针
2.14 Go语言变量的生命周期
2.15 Go语言常量
2.16 Go语言类型别名
2.17 Go语言关键字与标识符
2.18 Go语言运算符的优先级

3.1 Go语言数组
3.2 Go语言多维数组
3.3 Go语言切片
3.4 使用append()为切片添加元素
3.5 Go语言切片复制
3.6 Go语言从切片中删除元素
3.7 Go语言range关键字
3.8 Go语言多维切片
3.9 Go语言map（映射）
3.10 Go语言遍历map
3.11 map元素的删除和清空
3.12 Go语言sync.Map
3.13 Go语言list（列表）
3.14 Go语言nil：空值/零值

4.1 Go语言分支结构
4.2 Go语言循环结构
4.4 Go语言键值循环
4.5 Go语言switch语句
4.6 Go语言goto语句
4.7 Go语言break（跳出循环）
4.8 Go语言continue

5.1 Go语言函数声明
5.2 Go语言函数变量
5.3 Go语言匿名函数
5.4 Go语言函数类型实现接口
5.5 Go语言闭包（Closure）
5.6 Go语言可变参数
5.7 Go语言defer（延迟执行语句）
5.8 Go语言递归函数
5.9 Go语言处理运行时错误
5.10 Go语言宕机（panic）
5.11 Go语言宕机恢复（recover）
5.12 Go语言计算函数执行时间
5.13 Go语言Test功能测试函数

6.1 Go语言结构体定义
6.2 Go语言实例化结构体
6.3 初始化结构体的成员变量
6.4 Go语言构造函数
6.5 类型内嵌和结构体内嵌
6.6 初始化内嵌结构体
6.7 内嵌结构体成员名字冲突
6.8 Go语言垃圾回收和SetFinalizer
6.9 Go语言链表操作
6.10 Go语言数据I/O对象及操作

7.1 Go语言接口声明（定义）
7.2 Go语言实现接口的条件
7.3 Go语言类型与接口的关系
7.4 Go语言类型断言
7.5 Go语言排序
7.6 Go语言接口的嵌套组合
7.9 Go语言接口和类型之间的转换
7.10 Go语言空接口类型
7.11 Go语言类型分支
7.12 Go语言error接口

8.1 包的基本概念
8.2 Go语言封装简介及实现细节
8.3 Go语言GOPATH
8.4 Go语言常用内置包
8.5 Go语言自定义包
8.6 Go语言package
8.7 Go语言导出包中的标识符
8.8 Go语言import导入包
8.9 Go语言sync包与锁
8.10 Go语言big包
8.11 Go语言正则表达式：regexp包
8.12 Go语言time包：时间和日期
8.13 Go语言os包用法简述
8.14 Go语言flag包：命令行参数解析
8.15 Go语言go mod包依赖管理工具
8.16 Go语言runtime包:运行时

9.1 Go语言并发简述
9.2 Go语言轻量级线程
9.3 Go语言并发通信
9.4 Go语言竞争状态
9.5 Go语言调整并发的运行性能
9.6 并发和并行的区别
9.7 goroutine和coroutine的区别
9.8 Go语言通道（chan）
9.9 示例：并发打印
9.10 Go语言单向通道
9.11 Go语言无缓冲的通道
9.12 Go语言带缓冲的通道
9.13 Go语言channel超时机制
9.14 Go语言多核并行化
9.15 互斥锁和读写互斥锁
9.16 Go语言等待组
9.17 死锁、活锁和饥饿概述
9.18 Go语言CSP：通信顺序进程简述
9.19 示例：聊天服务器

10.1 Go语言反射（reflection）
10.2 Go语言反射规则浅析
10.3 通过反射获取类型信息
10.4 通过反射获取指针指向的元素类型
10.5 通过反射获取结构体的成员类型
10.6 Go语言结构体标签
10.7 通过反射获取值信息
10.8 通过反射访问结构体成员的值
10.9 判断反射值的空和有效性
10.10 通过反射修改变量的值
10.11 通过类型信息创建实例
10.12 通过反射调用函数
10.13 Go语言inject库：依赖注入

11.1 Go语言自定义数据文件
11.2 Go语言JSON文件的读写操作
11.3 Go语言XML文件的读写操作
11.4 Go语言使用Gob传输数据
11.5 Go语言纯文本文件的读写操作
11.6 Go语言二进制文件的读写操作
11.7 Go语言自定义二进制文件的读写操作
11.8 Go语言zip归档文件的读写操作
11.9 Go语言tar归档文件的读写操作
11.10 Go语言使用buffer读取文件
11.11 Go语言文件的写入、追加、读取、复制操作
11.12 Go语言文件锁操作

12.1 go build命令
12.2 go clean命令
12.3 go run命令
12.4 go fmt命令
12.5 go install命令
12.6 go get命令
12.7 go generate命令
12.8 go test命令
12.9 go pprof命令

13.1 Go语言的深拷贝和浅拷贝
13.2 Go语言引用传递和值传递
13.3 Go语言的Socket编程

14.1 Golang Map底层实现
14.2 go语言触发异常的场景有哪些
14.3 Printf()、Sprintf()、Fprintf()函数的区别用法是什么
14.4 详细说说new和make的区别
14.5 详细说说切片和数组的区别
14.6 Golang的内存模型，为什么小对象多了会造成gc压力
14.7 Data Race问题怎么解决？能不能不加锁解决这个问题
14.8 在 range 迭代 slice 时，你怎么修改值的
14.9 select可以用于什么
14.10 go语言编程的好处是什么
14.11 你是否主动关闭过http连接，为啥要这样做
14.12 recover的执行时机
14.13 说出一个避免Goroutine泄露的措施
14.14 如何跳出for select 循环
14.15 如何初始化带嵌套结构的结构体
14.16 Printf()、Sprintf()、Fprintf()函数的区别用法是什么
14.17 go语言中的引用类型包含哪些
14.18 说说go语言的select机制

推荐文章

三招快速搞定 Linux 文件批量重命名！
Linux 通过wget命令安装jdk1.8，安装部署apache-ActiveMQ队列消息
理解linux cpu load - 什么时候应该担心了
Boost在Linux和windows下的编译 32位 64位
关于LINUX的NVIDIA显卡驱动安装
linux centos ubutun svn搭建
安装MongoDB（Linux + Windows）
linux执行rm -rf /*命令后的效果原来是这样
Linux系统自杀实验 rm -rf /*
Linux之Django+uwsgi+nginx部署

猜你喜欢

随便看看

[源码和文档分享]基于Android实现的OA办公自动化系统
mac下sublime text 3 左侧栏目背景颜色修改
php图片加文字水印底部背景色水印
php图片水印文字铺满图片
那些一起追过@go的常用命令
win10家庭版安装Docker
win10家庭版安装使用Docke并使用Docker部署springboot
Windows 10家庭版安装Docker，没有Hyper-V怎么安装Docker
WIN10中DOCKER的安装与使用
Docker安装windows系统安装

Go语言中文社区 | 联系我们 | 官方标准库 | 京ICP备18055895号-2

欢迎关注Go语言社区官方微信公众号，商务合作联系QQ：124096702

Powered By Release 20180601 ©2009-2022 coder55.com

发送私信

发给:

内容:

如果觉得我的文章对您有用，请随意打赏。你的支持将鼓励我继续创作！