linux如何查看僵尸进程
作者:代元培
linux查看僵尸进程
1、查看系统是否有僵尸进程
使用Top命令查找,当zombie前的数量不为0时,即系统内存在相应数量的僵尸进程。
2、定位僵尸进程
使用命令ps -A -ostat,ppid,pid,cmd |grep -e '^[Zz]'定位僵尸进程以及该僵尸进程的父进程。
3、杀死僵尸进程
使用Kill -HUP 僵尸进程ID来杀死僵尸进程,往往此种情况无法杀死僵尸进程,此时就需要杀死僵尸进程的父进程。
kill -HUP 僵尸进程父ID
然后使用上面第二步的语句查询该僵尸进程是否被杀死。
4、参数解读
ps -A -ostat,ppid,pid,cmd |grep -e '^[Zz]'
-A 参数列出所有进程
-o 自定义输出字段 stat(状态)、ppid(进程父id)、pid(进程id)、cmd(命令)
因为状态为z或者Z的进程为僵尸进程,所以我们使用grep抓取stat状态为zZ进程
linux僵尸进程及僵尸进程的处理
僵尸进程
(1)进程中的指令已经执行完成,但是进程PCB结构还没有回收。
即子进程先于父进程退出后,子进程的PCB需要其父进程释放,但是父进程并没有释放子进程的PCB,这样的子进程就称为僵尸进程。
(2)父进程未结束,子进程结束,但父进程没有处理子进程的退出状态(当子进程先于父进程结束,父进程没有获取子进程的退出码,子进程的PCB会保留一段时间等待父进程在PCB中获取退出码,,且该进程不可执行,此时子进程变成僵尸进程)。
直到父进程获取到子进程的退出状态,子进程的PCB才会被移除。
我们的程序在退出的时候:return 0,exit(0),这个0就是退出码(状态信息),它存储在当前进程的PCB中,会有一个整型值来存储退出码。
当我们子进程结束以后,会把退出码写到PCB中,然后希望父进程可以获得到这个退出码,然后父进程就可以看到子进程是正常运行结束还是出错退出。正常的话我们return 0,失败的话我们return -1。
模拟僵尸进程:
僵死进程产生了,会有什么影响?
- 如果只有一两个僵死进程,没有什么影响。
- 如果有很多个僵死进程,持续不断的产生,就有影响了,因为子进程的PCB如果没有被释放,进程的PID就被一直占着,在内核空间中,PCB本身是结构体,会占用内存空间,对系统软硬件资源损耗,因此我们要避免僵死进程的产生,父进程有义务去处理!
何处理僵尸进程
父进程调用wait()方法获取子进程的退出码,从而使得OS删除子进程的PCB;
父进程先结束(该子进程就失去了父进程,系统会将这种没有子进程的父进程当做孤儿进程OS会给该孤儿进程重新寻找一个父进程Init进程,其PID == 1,通常会收养那些没有父进程的子进程,就会直接获取其退出码从而消除该进程的僵死状态 [ 其内部其实也是调用了wait()方法] )
如下图所示,修改之前的代码,让父进程先于子进程结束
执行结果如下:
我们可以看到失去父进程的子进程的PPID变为1,也就是Init
进程
父进程处理子进程退出状态(退出码)的方法
pid_t wait(int *result)//获取调用此方法的进程的子进程的退出码
- 如果没有子进程,则调用失败;
- 如果有子进程并且已经结束,则返回子进程的PID,退出码在result带回。
- 如果子进程没有结束,那么wait就会阻塞等待子进程结束。
我们来看一下wait的参考手册:
我们需要传入一个整形变量的地址,它会将退出码写到该地址中,返回值就是他获取到退出码的那个子进程的PID。
执行结果如下:这样就相当于父子进程是串行执行的,因此我们不会很简单粗暴地调用wait(),失去了多进程执行的意义,常会使用一些巧妙的方法,比如配合信号使用,这个在后面的博客中将会提到。
出现这种现象的原因是:父进程需要获取子进程的退出码,就需要等待子进程先结束,既然子进程没有结束,就无法获取子进程的退出码,wait()方法就相当于阻塞了父进程的运行。
如果有多个子进程,一次wait调用只能处理一个子进程(最先结束的哪一个)。
如下代码也用wait处理了僵尸进程,但我们需要解决另外一个问题:
注意:此时我们exit(0)的退出码是0
此时val的值为0
但是当我们将退出码改为3时,执行结果发生了变化,我们可以看到val = 768
这是为什么呢?
其实768对应的二进制数为0011 0000 0000,(11就是那个3)
——左移了8位,因为退出码一般来说是128以内的值,但是一个整型有4字节,1个字节本来就够存储退出码了,其他3个字节有别的作用了,所以在这里就发现被移位了,存储在该存储的位上。我们这怎么处理?
操作位是不大方便的,但是系统给我们提供了一些方法
- 第一个宏是用来判断程序是否是正常exit退出
- 如果是正常退出,就通过第二个宏得出退出码,这个宏就知道我们的退出码是在4个字节中的哪个字节存放的,精准取值,此时拿到的就是我们设定的3了,不是768了。
当程序还没有执行到exit就被杀死,获取到异常终止的信号,我们就用下面这个宏来判断
使用宏后,我们修改代码如下:
之后就可以看到正常的执行结果了
wait调用的最佳时机:子进程退出的那一时刻,父进程调用wait;
这里引入一个概念,在下一期Linux专栏将会讲到信号
若在父进程一开始就调用,那么就会出现串行执行的效果;
若在父进程快要结束的时候调用,那么父进程已经退出,处理僵尸进程就没有意义了。
总结
以上为个人经验,希望能给大家一个参考,也希望大家多多支持脚本之家。