之前参与的一个项目遇到过一个问题,我们的产品在拷机时发现:连续开机2天就会死机。这个问题交给了我来解决。
我查了几个小时代码,并没有发现明显的异常。好在我们的产品使用的Linux裁剪版系统,我想到可以用top命令来看内存变化。果然,经过2个小时的观察,发现内存是有规律减小的。因为我们的产品在运行过程中会涉及到一些文件的操作,所以感觉可能和这个有关。
运行lsof命令,提示”command not found”, 显然被裁掉了。于是决定自己移植一个。
最后发现,果然有个文件被多次打开,直到内存耗尽。
lsof是什么
* lsof -- list open files
移植过程
在http://www.mirrorservice.org/sites/lsof.itap.purdue.edu/pub/tools/unix/lsof/下载源码lsof_4.76.tar.gz
解压:$ tar zxvf lsof_4.76.tar.gz
进入目录lsof_4.76
配置kernel,运行configure
LINUX_KERNEL=/home/Smith/Kernel/2.6.28.9 LSOF_VERS=2142 ./Configure linux
* 上面的/home/Smith/Kernel/2.6.28.9是产品的linux kernel源码路径
配置Makefile
交叉编译工具: CC= mips-linux-gnu-gcc
设置小端: CFGF选项添加: -EL
设置linux版本号:
-DLSOF_VSTR=\”2.6.28.9\”
“2.6.28.9”是在产品上运行$uname –r得到的
编译:make, 生成lsof
lsof用法
运行lsof之后各字段说明
字段 | 含义 |
---|---|
COMMAND | 进程的名称 |
PID | 进程标识符 |
USER | 进程所有者 |
FD | 文件描述符,应用程序通过文件描述符识别该文件。如cwd、txt等 |
TYPE | 文件类型,如DIR、REG等 |
DEVICE | 磁盘 |
SIZE | 文件的大小 |
NODE | 索引节点 |
NAME | 打开的文件 |
使用举例
$ lsof
所有打开的文件
$ lsof -i23
查看端口23(telnet)
$ lsof bin/sh
查看打开bin/sh的所有进程
$ lsof /dev/malloc
查看查看打开/dev/malloc的所有进程