红联Linux门户
Linux帮助

Linux入门知识:杀死僵尸进程

发布时间:2014-12-16 15:05:08来源:linux网站作者:chengol

Linux并不把进程的树形结构导出给普通用户,然而在内核中,它却使用树形结构来管理进程。linux内核使用“子进程退出,父进程收尸,父进程退出,子进程被过继”这种方式来管理进程的死亡,然而却少了一种,那就是父进程不给子进程收尸的情况,这就是僵尸进程的原因。


既然知道了僵尸进程为何产生,那么想干掉它们就简单了。记住:任何没有人为因素的纯技术问题都是可以解决的!如何操作呢?很简单,就三步:

1.将僵尸进程从树形进程组织中摘除;
2.将僵尸进程过继给一个特定的进程;
3.该特定进程调用wait来回收掉它。

这三步岂不是很麻烦,直接干掉它的父进程不就得了,这样内核会自己将僵尸进程过继给别的进程或者init进程,然而有时我们不能这么做,如果它的父进程是个很重要的进程咋办,我们不能因为父辈抛弃了过早去世的孩子而责怪父亲,如果那样,linux内核的法律岂不是比我们还严重...既然父亲不要孩子了,那么建立一个收容所是必要的,使用上述三个步骤完成子进程空壳的过继和回收!这个收容所可以在内核空间也可以在用户空间,这不是最重要的。


本文给出了一个预研例子:

1.首先给出一个用户态进程代码:

#include <unistd.h>  
int main() 

int pid = 0; 
pid = fork(); 
if (pid == 0) { //子进程将瞬间变成僵尸,因为:1.父进程不回收;2.父进程不忽略  
} else { 
while (1) { 
//I'm VIP,though I am always sleeping!  
sleep(1); 


#include <unistd.h>  
int main() 

int pid = 0; 
pid = fork(); 
if (pid == 0) { //子进程将瞬间变成僵尸,因为:1.父进程不回收;2.父进程不忽略  
} else { 
while (1) { 
//I'm VIP,though I am always sleeping!  
sleep(1); 


}


2.然后给出一个内核模块代码:

unsigned long pid; //参数保存结束的僵尸进程的进程号  
module_param(pid, long, S_IRUSR);  
MODULE_PARM_DESC(pid, "pid");  
struct task_struct *(*find)(struct pid *pid, enum pid_type type); 
struct pid *(*get)(pid_t nr); 
long (*wait1)(pid_t pid, void *v, int options, void *ru); 
int __init rm_init(void){  
find = 0xc1041aed;   //根据pid结构得到task_t函数的地址  
get=0xc1041b81; //根据pid得到pid结构体函数的地址  
wait1 = 0xc1032e02; 
struct pid* spid = (*get)(pid); 
struct task_struct *tsk = (*find)(spid, PIDTYPE_PID); 
tsk->real_parent = current; 
tsk->parent = current; 
list_del(&tsk->sibling); 
list_add_tail(&tsk->sibling, &tsk->real_parent->children); 
(*wait1)(pid, NULL, 0, NULL); 
return 0;  
}  
void __exit rm_exit(void){  
}  
module_init(rm_init);  
module_exit(rm_exit);  
MODULE_LICENSE("GPL"); 

unsigned long pid; //参数保存结束的僵尸进程的进程号  
module_param(pid, long, S_IRUSR);  
MODULE_PARM_DESC(pid, "pid");  
struct task_struct *(*find)(struct pid *pid, enum pid_type type); 
struct pid *(*get)(pid_t nr); 
long (*wait1)(pid_t pid, void *v, int options, void *ru); 
int __init rm_init(void){  
find = 0xc1041aed;   //根据pid结构得到task_t函数的地址  
get=0xc1041b81; //根据pid得到pid结构体函数的地址  
wait1 = 0xc1032e02; 
struct pid* spid = (*get)(pid); 
struct task_struct *tsk = (*find)(spid, PIDTYPE_PID); 
tsk->real_parent = current; 
tsk->parent = current; 
list_del(&tsk->sibling); 
list_add_tail(&tsk->sibling, &tsk->real_parent->children); 
(*wait1)(pid, NULL, 0, NULL); 
return 0;  
}  
void __exit rm_exit(void){  
}  
module_init(rm_init);  
module_exit(rm_exit);  
MODULE_LICENSE("GPL");


上述的模块实现了僵尸进程的回收,虽然还不是很完美,然而起码证实了可行性,我们一些函数的地址还是通过procfs得到的。具体在代码润色方面,我有四个建议,这四个方式无论哪一个都是可行的,而且花不了太多时间,这里代码就从略了,如果写一下的话,充其量也只能锻炼一下c语言编程能力:


1.实现一个内核线程,专门实现模块init函数的逻辑,需要干掉的僵尸进程号通过procfs传入内核,然后在write例程中唤醒回收僵尸进程的内核线程;

2.实现一个用户态进程U,挂载一个信号A的处理函数,内部实现waitpid,通过procfs传入或者通过netlink传入内核的僵尸进程号代表的进程过继给用户态进程U,然后向U发送信号A;

3./dev/mem的机器码编程或者直接释放僵尸进程的task_t。

4.在/proc/<pid>/目录中加入kill-if-jiangshi文件,写入1如果该进程是僵尸,那么就调用上述模块的逻辑杀死它。