曙光信息产业股份有限公司
解决方案中心马少杰
2013年3月
目录
第1章高性能集三要素 (3)
第2章clusconf功能介绍 (3)
2.2 集管理功能 (3)
理疗环2.3 IPMI配置及管理功能 (4)
第3章使用前要求 (4)
第4章安装和配置 (4)
4.1 安装clusconf (4)
4.2 配置/etc/hosts文件 (4)
4.3 配置nfs.cfg 文件 (6)
4.4 配置ipmi.cfg文件 (7)
第5章Clusconf使用帮助 (8)
5.1 clusconf 使用选项 (8)
5.2 配置操作(setting Operation) (10)
降温母粒5.3 管理操作(Managing Operation) (11)
5.4 IPMI相关操作(IPMI Operation) (12)
骨灰戒指
第6章环境变量说明: (14)
第1章高性能集三要素
对于一个高性能集,至少需要满足三个要求:
1 全网全通,实现rsh或ssh的无密码访问
2 统一的用户信息,可以通过同步用户信息来实现或配置NIS来实现。
非接触测量
3 统一的文件印象,可以通过nfs(或并行文件系统)来实现。
第2章clusconf功能介绍
clusconf为一个设置集并行环境的程序,能够完成Linux系统下的整个集的配置、管理。默认为根据/etc/hosts 表来认定集中所有的节点,可以通过选项-p prefix和-n number 来自己定义集中的节点
包含功能:
2.1 集配置功能
1.为某个用户设置ssh 无密码访问(--set-ssh|-ss)
2.为所有用户设置rsh 无密码访问(--set-rsh|-sr)
3.按照集规范设置服务(--set-service|-sv)
4.设置整个集的nfs服务(--set-nfs|-sf)
5.按照预定的流程一键配置集(--set-all|-sa)
2.2 集管理功能
1.测试全网是否完全通过(--test-net|-tn)
2.显示集信息(--sys-info|-si)
3.显示整个集的cpu负载(负载大于5%的进程) (--disp-cpu|-dc)
4.同步整个集的用户(--sync-user|-yu)
5.添加一个用户到整个集(--useradd|--adduser|-au|-ua username)
6.删除一个用户到整个集(--deluser|--uerdel|-du|-ud username)
7.同步整个集的时间(--sync-time|-yt)
8.同步整个集的某个文件(--sync-file|-yf file|files|path|paths)
9.在整个集上执行相同的命令(--sync-do|-yd command)
2.3 IPMI配置及管理功能
1.配置ipmi IP地址(--set-ipmi|-si)
2.显示ipmi的IP地址及显示电源状态(--ipmi-info|-ii)
3.IPMI远程开机(--ipmi-poweron|-in)
4.IPMI 远程关机(--ipmi-poweroff|-if)
5.IPMI 远程智能开机,可根据集的角自动规划开机顺序(--ipmi-ipoweron|-iin)
6.IPMI 远程智能关机,可根据集的角自动规划开机顺序(--ipmi-ipoweroff|-iif)
第3章使用前要求
1 整个集中所有节点操作系统安装好。
2 整个集中所有节点的网络连接好,IP配置完成。
第4章安装和配置
4.1 安装clusconfpvc电线槽
1 tar xvzf
2 cd clusconf-1.5
3 ./install
根据提示输入安装路径,默认路径为/opt/clusconf
查看安装路径下是否有2个路径bin和etc
载入环境变量
4 source /etc/profile.d/clusconf-env.sh
5 which clusconf查看安装路径
4.2 配置/etc/hosts文件
/etc/hosts 文件为域名解析服务设置文件,clusconf默认根据/etc/hosts中定义的节点(默认前缀为node)对整个集进行操作和设置。
/etc/hosts 文件设置规范如下
假设某集有30个计算节点,2个IO节点,1个管理节点,系统有1套(或2套)以太管理网,1套IB网络,1套ipmi网络,/etc/hosts表的设置规范如下:
127.0.0.1 localhost
光端机箱10.10.10.1 node1 comput1
10.10.10.2 node2 comput2
…….
10.10.10.30 node30 comput30
10.10.10.31 node31 io1
10.10.10.32 node32 io2
10.10.10.33 node33 admin1
10.10.20.1 mnode1
……
10.10.20.33 mnode33
12.12.12.1 inode1
……
12.12.12.33 inode33
11.11.11.1 bnode1
……
11.11.11.33 bnode33
注意:(1)严格按照目前实际的节点数目(不要多余的),IP地址的最后一位和node的数字后缀要一致。其它/etc/hosts配置规范请参考《曙光HPC调试规范》和附录集IP地址与主机名规范(2)遇到用户有自己主机名命名规则的情况,可按照用户要求命名主机名,在/etc/hosts 表设置里多加一列,如下(例如用户要求命名为xxx1到xxx33)
127.0.0.1 localhost
10.10.10.1 node1 comput1 xxx1
10.10.10.2 node2 comput2 xxx2
…….
10.10.10.30 node30 comput30 xxx30