1、内核CRASH信息收集:
# rpm -ivh lkcdutils-4.2-193.68.rpm
# insserv -v /etc/init.d/boot.lkcd,start=3,5
# 在文件/etc/rc.d/boot.swap的下列行
echo "Activating remaining swap-devices in /etc/fstab..."
之前加入如下一行:
/sbin/lkcd save
把/etc/rc.d/boot.lkcd中的行“/sbin/lkcd save”删除。
# cat /etc/sysconfig/dump
DUMP_ACTIVE="1"
DUMPDEV="/dev/cciss/c0d0p1" #使用交换区
DUMPDIR="/var/log/dump"
DUMP_LEVEL="4"
DUMP_COMPRESS="2"
DUMP_FLAGS="0x80000000"
DUMP_SAVE="1"
PANIC_TIMEOUT="5"
BOUNDS_LIMIT=3
KEXEC_IMAGE=/boot/vmlinuz
# cat /etc/sysconfig/sysctl
........
ENABLE_SYSRQ="yes"
重启机器,如果不想重启机器那么执行下面两条命令即可:
# /sbin/lkcd config
# echo 1 >/proc/sys/kernel/sysrq
# cat /proc/interrupts查看NMI计数是否有变化(每秒100多次),如果增加了说明NMI_watchdog已经开启。否则需要把nmi_watchdog=1加到/boot/grub/menu.lst中并重启机器。
# ls -d /proc/sys/kernel/dump/ --如果不存在表明内核不支持lkcd。
2、测试:
# /sbin/lkcd dump
或:
# echo d >/proc/sysrq-trigger
或
卸载不必要的文件系统;进入控制台发出命令:
Alt-SysRq-u --所有的文件系统以只读方式mount
Alt-SysRq-c --crash内核
# /sbin/lkcd save --把dump设备上内容考出
3、验证有效性:
# cd /var/log/dump/x ---进入第x次dump的目录
# /sbin/lcrash -n x
>>ps ---显示dump时的进程
>>trace
>>q