首页 > 网站技巧 > 服务器 > Linux > linux查看僵尸进程

linux如何查看僵尸进程

2023-03-23 10:05:19 作者：代元培

这篇文章主要介绍了linux如何查看僵尸进程问题，具有很好的参考价值，希望对大家有所帮助。如有错误或未考虑完全的地方，望不吝赐教

linux查看僵尸进程

1、查看系统是否有僵尸进程

使用Top命令查找，当zombie前的数量不为0时，即系统内存在相应数量的僵尸进程。

linux查看僵尸进程

2、定位僵尸进程

使用命令ps -A -ostat,ppid,pid,cmd |grep -e '^[Zz]'定位僵尸进程以及该僵尸进程的父进程。

3、杀死僵尸进程

使用Kill -HUP 僵尸进程ID来杀死僵尸进程，往往此种情况无法杀死僵尸进程，此时就需要杀死僵尸进程的父进程。

kill -HUP 僵尸进程父ID

然后使用上面第二步的语句查询该僵尸进程是否被杀死。

4、参数解读

ps -A -ostat,ppid,pid,cmd |grep -e '^[Zz]'

-A 参数列出所有进程

-o 自定义输出字段 stat（状态）、ppid（进程父id）、pid（进程id）、cmd（命令）

因为状态为z或者Z的进程为僵尸进程，所以我们使用grep抓取stat状态为zZ进程

linux僵尸进程及僵尸进程的处理

僵尸进程

（1）进程中的指令已经执行完成，但是进程PCB结构还没有回收。

即子进程先于父进程退出后，子进程的PCB需要其父进程释放，但是父进程并没有释放子进程的PCB，这样的子进程就称为僵尸进程。

（2）父进程未结束，子进程结束，但父进程没有处理子进程的退出状态（当子进程先于父进程结束，父进程没有获取子进程的退出码，子进程的PCB会保留一段时间等待父进程在PCB中获取退出码，，且该进程不可执行，此时子进程变成僵尸进程）。

直到父进程获取到子进程的退出状态，子进程的PCB才会被移除。

我们的程序在退出的时候：return 0，exit(0)，这个0就是退出码（状态信息），它存储在当前进程的PCB中，会有一个整型值来存储退出码。

当我们子进程结束以后，会把退出码写到PCB中，然后希望父进程可以获得到这个退出码，然后父进程就可以看到子进程是正常运行结束还是出错退出。正常的话我们return 0，失败的话我们return -1。

模拟僵尸进程：

在这里插入图片描述

僵死进程产生了，会有什么影响？

如果只有一两个僵死进程，没有什么影响。
如果有很多个僵死进程，持续不断的产生，就有影响了，因为子进程的PCB如果没有被释放，进程的PID就被一直占着，在内核空间中，PCB本身是结构体，会占用内存空间，对系统软硬件资源损耗，因此我们要避免僵死进程的产生，父进程有义务去处理！

何处理僵尸进程

父进程调用wait()方法获取子进程的退出码，从而使得OS删除子进程的PCB；

父进程先结束（该子进程就失去了父进程，系统会将这种没有子进程的父进程当做孤儿进程OS会给该孤儿进程重新寻找一个父进程Init进程，其PID == 1，通常会收养那些没有父进程的子进程，就会直接获取其退出码从而消除该进程的僵死状态 [ 其内部其实也是调用了wait()方法] ）

如下图所示，修改之前的代码，让父进程先于子进程结束

在这里插入图片描述

执行结果如下：

在这里插入图片描述

我们可以看到失去父进程的子进程的PPID变为1，也就是Init进程

在这里插入图片描述

父进程处理子进程退出状态（退出码）的方法

pid_t wait(int *result)//获取调用此方法的进程的子进程的退出码

如果没有子进程，则调用失败；
如果有子进程并且已经结束，则返回子进程的PID，退出码在result带回。
如果子进程没有结束，那么wait就会阻塞等待子进程结束。

我们来看一下wait的参考手册：

在这里插入图片描述

我们需要传入一个整形变量的地址，它会将退出码写到该地址中，返回值就是他获取到退出码的那个子进程的PID。

在这里插入图片描述

执行结果如下：这样就相当于父子进程是串行执行的，因此我们不会很简单粗暴地调用wait()，失去了多进程执行的意义，常会使用一些巧妙的方法，比如配合信号使用，这个在后面的博客中将会提到。

出现这种现象的原因是：父进程需要获取子进程的退出码，就需要等待子进程先结束，既然子进程没有结束，就无法获取子进程的退出码，wait()方法就相当于阻塞了父进程的运行。

在这里插入图片描述

如果有多个子进程，一次wait调用只能处理一个子进程（最先结束的哪一个）。

如下代码也用wait处理了僵尸进程，但我们需要解决另外一个问题：

注意：此时我们exit(0)的退出码是0

在这里插入图片描述

此时val的值为0

在这里插入图片描述

但是当我们将退出码改为3时，执行结果发生了变化，我们可以看到val = 768

在这里插入图片描述

这是为什么呢？

其实768对应的二进制数为0011 0000 0000，(11就是那个3)

——左移了8位，因为退出码一般来说是128以内的值，但是一个整型有4字节，1个字节本来就够存储退出码了，其他3个字节有别的作用了，所以在这里就发现被移位了，存储在该存储的位上。我们这怎么处理？

操作位是不大方便的，但是系统给我们提供了一些方法

第一个宏是用来判断程序是否是正常exit退出
如果是正常退出，就通过第二个宏得出退出码，这个宏就知道我们的退出码是在4个字节中的哪个字节存放的，精准取值，此时拿到的就是我们设定的3了，不是768了。

在这里插入图片描述

当程序还没有执行到exit就被杀死，获取到异常终止的信号，我们就用下面这个宏来判断

在这里插入图片描述

使用宏后，我们修改代码如下：

在这里插入图片描述

之后就可以看到正常的执行结果了

在这里插入图片描述

wait调用的最佳时机：子进程退出的那一时刻，父进程调用wait；

这里引入一个概念，在下一期Linux专栏将会讲到信号

若在父进程一开始就调用，那么就会出现串行执行的效果；

若在父进程快要结束的时候调用，那么父进程已经退出，处理僵尸进程就没有意义了。

总结

以上为个人经验，希望能给大家一个参考，也希望大家多多支持脚本之家。

linux如何查看僵尸进程

linux查看僵尸进程

linux僵尸进程及僵尸进程的处理

僵尸进程

何处理僵尸进程

父进程处理子进程退出状态（退出码）的方法

总结

您可能感兴趣的文章: