linux的CPU使用率达到100%的快速定位过程
作者:忍冬行者
本文描述了在CentOS 7.9操作系统上排查CPU异常告警的过程,通过使用top和jstack命令,找到了最耗CPU的进程和线程,并根据堆栈信息定位到了对应代码
问题现象
Linux服务器(操作系统版本是centos7.9)上面部署了若干Java站点服务,突然收到运维的CPU异常g告警,到了影响业务的情况发生,经初步排查,未出现异常进程,排除挖矿病毒的原因。
排查思路
(1)找到最耗CPU的进程;
(2)找到最耗CPU的线程;
(3)查看堆栈,定位线程在干嘛,定位对应代码;
排查步骤
1.找到最耗CPU的进程
方法:使用top命令
- 执行top -c ,显示进程运行信息列表
- 键入P (大写p),进程按照CPU使用率排序
2.找到最耗CPU的线程
方法:使用top工具
- top -Hp ,显示一个进程的线程运行信息列表
- 键入P (大写p),线程按照CPU使用率排序
- top -Hp 30365
3.查看堆栈,定位线程在干嘛,定位对应代码
- 首先,将线程PID转化为16进制。
- 工具:printf
- 方法:printf "%x\n" 6080
如上图,6080对应的16进制是0x17c0
之所以要转化为16进制,是因为堆栈里,线程id是用16进制表示的
4.查看堆栈,找到线程在干嘛
- 工具:jstack
- 方法:jstack 30365 | grep '0x17c0' -C5 --color
- 最后,根据堆栈里的信息,找到对应的代码.
总结
以上为个人经验,希望能给大家一个参考,也希望大家多多支持脚本之家。