最近遇到了一个程序运行时间长后,操作系统由于out of memory 导致系统的oom-killer将程序直接杀死的问题:
错误提示大概为:
Out of memory: Kill process 20011 (main) score 58 or sacrifice child
Killed process 20011 (main) total-vm:21688384kB, anon-rss:715844kB, file-rss:816256kB
这些错误可以在linux系统的/var/log/syslog文件中找到。
解决方法1:
修改/proc/sys/vm/lowmem_reserve_ratio文件,即:echo 512 > /proc/sys/vm/lowmem_reserve_ratio
1、malloc是分配虚拟地址空间,如果不memset或者bzero,那么就不会触发physical allocate,不会映射物理地址,所以这里用bzero填充
2、每次申请的block大小比较有讲究,Linux内核分为LowMemroy和HighMemroy,LowMemory为内存紧张资源,LowMemroy有个阀值,通过free -lm和
/proc/sys/vm/lowmem_reserve_ratio来查看当前low大小和阀值low大小。低于阀值时候才会触发oom killer,所以这里block的分配小雨默认的256M,否则如果每次申请512M(大于128M),malloc可能会被底层的brk这个syscall阻塞住,内核触发page cache回写或slab回收。
解决方法2:
调整3个虚拟内存参数:
l vm.min_free_kbytes=409600
l vm.vfs_cache_pressure=200
l vm.swappiness =40
调整MIN_FREE_KBYTES的目的是保持物理内存有足够的空闲空间,防止突发性的换页。Swapiness缺省为60,减少swapiness会使系统尽快通过swapout不使用的进程资源来释放更多的物理内存。Vfs_cache_pressure的缺省值是100,加大这个参数设置了虚拟内存回收directory和i-node缓冲的倾向,这个值越大,回收的倾向越严重。调整这三个参数的目的就是让操作系统在平时就尽快的回收缓冲,释放物理内存,这样就可以避免突发性的大规模换页。
sysctl命令调整了三个参数:
#sysctl -w vm.min_free_kbytes=409600//我这里改的是3000000单位是k字节(因为我的内存为8GB),也就是cache页最少要为3GB,小了就让系统内核释放物理内存
#sysctl -w vm.vfs_cache_pressure=200
#sysctl -w vm.swappiness=40
参数修改完毕后,进入/proc/sys/vm目录,检查这三个参数是否修改正确:
#cd /proc/sys/vm
#cat min_free_kbytes
#cat vfs_cache_pressure
#cat swappiness
参数修改完毕后,过了几分钟,1号节点上的空闲物理内存明显回升。说明参数确实起作用了。上面的操作完成了对目前系统的调整,永久性的设置需要修改/etc/sysctl.conf参数文件。
cd /etc
#cp sysctl.conf sysctl.conf.save20080304
#vi sysctl.conf
添加如下内容:
#modify vm parameter
vm.min_free_kbytes=409600
vm.vfs_cache_pressure=200
vm.swappiness =40
解决方法3:
直接修改/proc/PID/oom_adj文件,将其置位-17,此时oom-killer选择kill程序时,要保护的进程的score 值为0,score值越高,oom-killer就越会选择该程序,将其杀死
echo -17 /proc/8163/oom_adj
解决方法4:
直接关闭oom-killer
OOM Killer的关闭与激活方式:
# echo "0" > /proc/sys/vm/oom-kill
# echo "1″ > /proc/sys/vm/oom-kill
ubuntu手动释放缓存(清理内存cache):http://www.linuxdiyf.com/linux/14072.html
Linux下如何释放cache内存:http://www.linuxdiyf.com/linux/8252.html
在Linux上如何清除内存的Cache、Buffer和交换空间:http://www.linuxdiyf.com/linux/12574.html
Linux OOM killer机制:http://www.linuxdiyf.com/linux/13283.html