下载
首先下载PBS Pro,这里使用v14.1.0版本。下载地址:https://github.com/PBSPro/pbspro/archive/v14.1.0.tar.gz
下载后将文件名改为pbspro-14.1.0.tar.gz
准备机器
准备两个机器,机器名分别为pbsmaster和pbsslave。
修改两个机器的/etc/hosts文件,确保两个机器可以互相访问。
制作RPM包
以下命令使用root用户运行
# mkdir -p /root/rpmbuild/SOURCES/
# mv pbspro-14.1.0.tar.gz /root/rpmbuild/SOURCES/pbspro-14.1.0.tar.gz
# cd /root/rpmbuild/SOURCES && tar zxvf pbspro-14.1.0.tar.gz
# cd /root/rpmbuild/SOURCES/pbspro-14.1.0 && rpmbuild -ba pbspro.spec
执行上面命令后,会在/root/rpmbuild/RPMS/x86_64目录下生成几个rpm包,如下:
pbspro-client-14.1.0-0.x86_64.rpm
pbspro-debuginfo-14.1.0-0.x86_64.rpm
pbspro-execution-14.1.0-0.x86_64.rpm
pbspro-server-14.1.0-0.x86_64.rpm
安装Master
登录master节点,然后以root用户运行
# yum install -y pbspro-server-14.1.0-0.x86_64.rpm
修改/etc/pbs.conf文件
PBS_SERVER=pbsmaster
PBS_START_MOM=1
安装Slave
登录master节点,然后以root用户运行
# yum install pbspro-execution-14.1.0-0.x86_64.rpm
修改/etc/pbs.conf文件
PBS_SERVER=pbsmaster
修改/var/spool/pbs/mom_priv/config文件
$clienthost pbsmaster
启动pbs
分别在pbsmaster和pbsslave节点上运行以下命令启动pbs
# /etc/init.d/pbs start
将slave节点加入集群
# . /etc/profile.d/pbs.sh
# qmgr -c 'create node pbsslave'
测试
使用普通用户登录master节点,然后运行
$ . /etc/profile.d/pbs.sh
# 查看节点状态
$ pbsnodes -a
# 提交作业
$ echo 'sleep 123' | qsub
# 查看作业
$ qstat -a