在读《unix环境高级编程》时,发现忽然对僵死进程的处理机制很感兴趣,经过查阅资料弄清楚了其中的原理,在这里做一个记录。
1.一个进程的离去
在一个进程调用 exit 函数,或者 return 语句,或者是调用 abort 等函数终止后,总之不管进程是怎样终止的,它们在终止之后,都会去执行内核中的一个代码片断。这个代码片断负责关闭终止进程打开的文件描述符,释放终止进程占用的内存空间。但是,是否终止进程在系统中就从此消失,以后该进程在系统中,就再也找不到这个终止进程的一点踪影呢,答案是否定的。
2.僵死进程
一个进程在终止之后,会释放它所占用的一切资源。但是会在进程表中保留该进程的一些生前的信息,比如进程ID,进程使用的CPU时间,退出状态等。这时这个终止进程的状态就称之为僵死状态,它要等待它的父进程来为它收尸。这时候在 linux 系统中,僵死进程的状态被打印为 ‘Z’,它的父进程通过调用 wait 或者是 waitpid 函数来为其善后。
3.动手做,理解僵死进程
僵死进程是怎么产生的呢?这是因为,在一个程序中,不断的调用fork函数,却没有调用 wait 或者 waitpid 函数来做清除工作,而该程序又没有终止,这样就会在系统中产生僵死进程。解释了这么多概念,不如给一个例子可能会更加的清晰,下面的一个例子用来在系统中产生僵死进程:
#include <stdio.h>
#include <unistd.h>
int main(void)
{
pid_t pid;
while(1)
{
if( (pid=fork())<0 )
{
printf("fork error\n");
return -1;
}
else if( pid==0 )
{
printf("child\n");
_exit(0);
}
else
{
sleep(1);
}
}
return 0;
}
将程序编译完成之后,执行,会每隔1秒钟产生一个子进程。在子进程中输出提示信息 child 之后就立即退出。这个程序在执行的时候,我们再开一个终端,输入命令:
ps aux | grep 'Z'
可以看到输出结果如下:
USER PID %CPU %MEM VSZ RSS TTY STAT START TIME COMMAND
asus 3213 0.0 0.0 0 0 pts/0 Z+ 20:54 0:00 [a.out] <defunct>
asus 3214 0.0 0.0 0 0 pts/0 Z+ 20:54 0:00 [a.out] <defunct>
asus 3215 0.0 0.0 0 0 pts/0 Z+ 20:54 0:00 [a.out] <defunct>
asus 3217 0.0 0.0 0 0 pts/0 Z+ 20:54 0:00 [a.out] <defunct>
asus 3271 0.0 0.0 0 0 pts/0 Z+ 20:54 0:00 [a.out] <defunct>
asus 3272 0.0 0.0 0 0 pts/0 Z+ 20:54 0:00 [a.out] <defunct>
asus 3273 0.0 0.0 0 0 pts/0 Z+ 20:54 0:00 [a.out] <defunct>
asus 3274 0.0 0.0 0 0 pts/0 Z+ 20:54 0:00 [a.out] <defunct>
asus 3275 0.0 0.0 0 0 pts/0 Z+ 20:54 0:00 [a.out] <defunct>
asus 3276 0.0 0.0 0 0 pts/0 Z+ 20:54 0:00 [a.out] <defunct>
asus 3277 0.0 0.0 0 0 pts/0 Z+ 20:54 0:00 [a.out] <defunct>
asus 3282 0.0 0.0 0 0 pts/0 Z+ 20:54 0:00 [a.out] <defunct>
asus 3343 0.0 0.0 0 0 pts/0 Z+ 20:54 0:00 [a.out] <defunct>
asus 3344 0.0 0.0 0 0 pts/0 Z+ 20:54 0:00 [a.out] <defunct>
我们可以看到这些进程的STAT都为僵死进程。如果我们按 ctrl+c 把执行的程序终止,再次执行这个命令,会发现在系统中所有产生的僵死进程都消失了。
感觉很奇怪吧,既然这些僵死进程都消失了,那么就一定有一个进程为系统种的僵死进程收尸,这个进程就是 init 进程,它的PID为1。原来在 linux 中,当一个进程的父进程终止时,这个进程就成为了孤儿进程,那么 init 进程就是一个好心的人了,它专门收养孤儿进程。而 init 进程又被实现为,当它有一个子进程终止时,就立即调用 wait 函数来善后。所以就我们刚才的例子来说,当我们把程序终止后,所有僵死进程的父进程就变成了 init,而 init 发现,哦,原来你们都是僵死进程啊,所以它给每一个僵死进程调用 wait 函数,是使它们能够安心离去。init 进程的这种实现方式使得 linux 系统中的僵死进程不会太多。当然,如果这个程序永远不终止,那么系统中的僵死进程就会越来越多。
注意:一个僵死进程在内存中已经没有程序的正文和数据,所以不能使用 kill 来杀死一个僵死的进程。只能通过杀死僵死进程的父进程来清除僵死进程,或者在父进程中调用wait或waipid函数来清除。