(第一部分)
ROSE双机热备解决方案
前言
数字化建设是一个庞大而复杂的系统工程,其整体系统由上百个业务子系统组建而成,而这些系统间又有频繁的数据交换和业务联动,数据/信息中心系统的建设和部署是整个数字化系统建设的核心和基础,其架构设计是一项复杂的工作。本方案提出双机热备硬件平台基础架构的概述。 本方案针对数字化基础架构,帮助各个层次上保持正常、健康的运行。具体flag标签抗体方案如下:
一、高可用性评估:
对 IT 可用性计划、流程、过程、角、职责、报告、控制和服务水平实现情况进行分析;
通过事后分析、故障成本或组件故障影响分析技术,对可能发生的故障进行分析; 二、高可用性规划与设计
对高可用性进行规划,包括计划、计划管理、报告和服务水平管理、高可用性流程和过程设计,包括角和职责。
三、高可用性实施
四、容灾规划与实施服务
数据中心和灾备中心连续性接管服务,灾难恢复演练计划制定与实施。
一.系统环境
1。1 方案业务简述
本方案的核心是统一的高性能的NAS架构,大部分数据都存储在NAS的环境中,通过交换机连接不同的数据库服务和应用服务器进行各种业务处理.为支持越来越高的业务连续性要求。 二.关健业务连续性系统设计
2。1 基础架构
2.2 系统设计说明
1。 服务器、存储和软件系统
本方案的核心是统一的高性能的NAS架构,大部分数据都存储在NAS的环境中,通过交换机连接不同的数据库服务和应用服务器进行各种业务处理.
根据我们对业务系统的分析,充分满足对系统数据容量的规划,建议配置如下:
✓2两台服务器建议选择IBM X3650 M4,每台建议配置如下:
|
服务器类型 | 2U机架式 |
CPU | 八核至强E5—2650(2。0G主频/20MB三级缓存/最高支持1600MHz内存频率),可扩展至2个处理器 |
内存(RAM) | 2*8GB 1333MHz RDIMM内存 |
硬盘 | 4*300G 2。5”HDD |
网络 | 4口千兆网卡 |
光驱 | DVD光驱 |
HBA 卡 | I BM 6Gb SAS HBA*2 |
电源 | 双电源冗余 |
| |
✓磁盘阵列建议选择IBM DS3512,建议配置如下:
|
控制器类型 | 单控制器 |
硬盘配置 | 2TB 7.2K 3。5" NL HDD SAS*4 | 易切削不锈钢
互联线 热轧螺纹钢 | 3m SAS Cable*2 |
电源 | 双电源冗余 |
| |
✓双机软件选择RoseHA 一套,配置如下:
RoseHA 双机容错系统 |
RoseHA for Windows | Windows 2000/2003/2008 Server for x86—64 三板模 (Standard / Advanced / Datacenter Edition) | |
|
| |
操作系统要求选择支持大内存和硬盘RAID功能.
两台IBM X3650M4双机系统为数据库服务器,两台互为备份,这大大提高了系统的可靠性,
在任意一台服务器发生故障时整个系统能够继续安全良好的运行。
数据存储方面,根据业务要求,确定了数据集中结构、数据冗余备份写入,服务器通过交换机和DS3512磁盘阵列组网。
为提供存储底层可靠性,我们建议配置1台DS3512阵列柜,阵列各划分划分多外逻辑卷—供不同的应用服务器使用。
数据库文件和控制文件、应用程序文件全部建议放置在磁盘阵列上,在发生双机切换时无需手工同步文件。
2.3 系统方案特点
∙存储使用阵列,即稳定可靠、绝对数据安全而且成本较低,充分节省用户投资;
∙服务器、网卡、电源模块等关健设备全部使用冗余设计,无单点故障;
∙双机软件快速反映,错误检测时间小于10秒,故障切换及恢复时间一般在10—20秒;
∙双机软件GUI与Server分离,可随时中断GUI而不影响Server的运行;
∙支持JOB和BRING IN/BRING OUT、在一台SERVER上停止JOB不会导致FAILOVER
∙在同一块网卡上建立多个活动的IP地址,支持多个JOB的运行
∙自动切换:当系统出现故障时(如:系统宕机、HA进程/应用进程被杀掉、RS—232僧侣鞋、SCSI、光纤、网络线缆断开),RoseHA 将确定故障原因,并采取相应对策,并将这些应用切换到备份服务器上。而故障服务器中未受影响的应用不会被切换,既不会受任何影响。不需要系统管理员干预。mc尼龙滑轮
三.附录
3.1 RoseHA 双机容错系统
RoseHA是利用共享磁盘阵列实现系统高可用性,保证应用系统7*24不间断运行的软件产品.ROSE HA软件同时安装在两台主机上,用于监视系统的状态,协调两台主机的工作,维护系统的可用性。它能侦测应用级系统软件、硬件发生的故障,及时地进行错误隔绝、恢复,以最低成本提供用户几乎不停顿的计算机作业环境.
RoseHA 以其稳定、可靠,在windows2000、windows2003、windows2008服务器的容错软件中占有绝对的优势,同时也成为国内绝大多数的磁盘阵列柜厂家的OEM容错软件。
工作模式
∙主从方式(Active/Standby) 主机工作,从机处于监控准备状态。当主机宕机时,从机接管从机的工作,待主机恢复正常后,按使用者的预定以自动或手动的方式将服务切换到主机上运行。
∙双工方式(Active/Active) 两台主机同时运行各自的服务工作,且相互监测对方的情况.当一台主机宕机时,另外一台主机立即接管它的工作,保证工作不间断。 譬如:A机运行ORACLE数据库应用,B机运行IIS网站应用。
特 点
∙自动切换 当系统出现故障时(如:系统宕机、HA进程/应用进程被杀掉、RS—232、SCSI、光纤、网络线缆断开),RoseHA 将确定故障原因,并采取相应对策,并将这些应用切换到备份服务器上.而故障服务器中未受影响的应用不会被切换,既不会受任何影响。
不需要系统管理员干预.
∙支持多条心跳路径 可以将网线和RS-232串口线作为在RoseHA软件的心跳路径。配置多条心跳路径可以避免系统的单点故障。两台服务器的信息交换可通过:RS232、TCP/IP
∙自动检测 在集系统的每一台服务器内,RoseHA具有两个核心进程,它们互相监控,如果其中一个进程失败,另一个进程会立即进行恢复。
∙丰富的附加功能 提供不同的针对特定应用的Agent程序,使服务监控更切实际,更加有效;提供用于开发Agent程序的应用程序界面(API),使用者可针对特定的服务编写Agent程序,执行与特定服务相关的状态诊断及错误恢复工作的.