三、ROSE 双机软件系统结构
ROSE CLUSTER 双机软件采用结构化设计,系统结构简图如下: |
 |
在ROSE CLUSTER 双机双机软件中,采用严谨的结构化设计,模块和功能可以以模块方式进行堆叠,实现双机功能的灵活增加和定制。
AsMgrl 模块:实现双机系统的C/S客户端配置管理工具,通过该模块实现对双机系统的远程配置.管理及维护等功能。
Daemon 模块:双机状态的管理模块,负责检测双机的工作状态,以及对故障状态进行双机调整。
St-Task 模块:双机功能的执行模块,负责执行Daemon 模块发出的双机调整状态命令等。
3.1 ROSE双机管理/控制摸块
ROSE CLUSTER 双机软件的管理/控制模块主要完成以下功能:
◎ ROSE对双机状态的检测:在双机中实时监控自身节点的状态,同时监控对方节点的双机资源状态,保障在任何时候均能得到自己和对方节点的状态,防止双机出现错误判断。
◎ ROSE 对失效节点进行处理:对定义在双机中的有效节点,当发生故障时,Daemon 模块需要对该故障节点进行处理。当该节点为备份节点时,则对任务进行禁止转移处理。如故障节点为生产节点时,则根据当前的状态,由有效的备份节点对任务进行接管,保障业务系统不间断运行。
◎ ROSE对失效任务进行处理:失效的任务形成有以下几个因素,存储设备链路故障、关键任务意外丢失、网络故障以及服务器及其操作系统故障。针对失效的任务,ROSE CLUSTER Software 双机软件根据当前节点的角色进行相应的双机状态调整,保障整个业务系统健壮运行。
◎ ROSE对双机状态进行调整:ROSE CLUSTER 双机系统根据实时采集的双机状态信息,对当前运行的节点进行状态上的调整,如心跳链路的改变、双机任务的转移、报警等处理。
3.2 ROSE双机执行摸块
ROSE CLUSTER 双机系统的执行模块根据Daemon 模块发出的操作、执行命令主要完成以下功能:
3.2.1 ROSE对双机卷资进行控制
在ROSE CLUSTER 双机系统运行过程中,对定义在双机系统中的共享磁盘文件系统进行必要的控制。
◎ 在生产主机时,需要对共享的:磁盘文件系统进行解锁操作,使生产服务器对双机文件系统进行读写操作。
◎ 备份节点上对共享的磁盘文件系统进行加锁锁定,防止备份服务器对文件系统的读写操作.保障数据安全。
◎ 在进行任务移交的过程中,对文件系统进行同步处理,保持文件及其记录的一致性。
3.2.2 ROSE对双机网络源进行控制
在ROSE CLUSTER 双机系统运行过程中,对定义在双机系统中的网络资源进行调整和控制,根据当前节点的角色,对网络资源进行不同的操作:当节点为生产主机时,对网络添加双机虚拟IP、为客户端提供服务的虚拟地址。当任务进行转移或主机故障时,则对网络进行进行删除双机虚拟IP 的操作,由备份服务器对任务进行接管。当ROSE CLUSTER 双机软件正常运行时,执行模块根据Daemon 的要求,对网络状态进行实时检测,并返回检查结果。
3.2.3 ROSE对双机服务进行控制
在ROSE CLUSTER 双机系统中,对定义的服务进行状态监控,当服务状态处于故障时,则对任务进行移交。保障任务的健壮运行。防止出现因服务故障导致整个应用系统不可用状态。
3.2.4 ROSE对用户进程进行控制
在ROSE CLUSTER 双机系统中,用户可以灵活定义自己开发的应用系统,使应用系统在双机系统中受到保护,当定义的应用程序出现故障后,ROSE CLUSTER 双机系统自动将任务转移到备份服务器上,保障业务系统不间断运行。根据用户需求,可以开放ROSE CLUSTER 双机软件的API 接口,使应用系统和双机系统紧密结合起来,实现真正的高可用系统。
四、ROSE双机软件软件工作过程
ROSE双机系统软件是由LcMgrl、Daemon和St-Task三部分组成,这三部分协同工作,共同完成主机系统的备援工作。
ROSE软件在启动时,首先读取双机系统的配置文件,在该文件中描述双机系统中各节点的网络信息,硬件描述以及任务的定义等参数。
双机核心程序根据双机的配置信息,进行双机系统的状态重组。根据当前的网络状态和双机参数,对节点中的服务器进行调整,建立双机的初始状态。
在节点初始状态建立起来后,Daemon管理模块根据执行模块采集传递的当前网络状态的信息。根据定义的规则,对双机进行调整并分配双机网络资源,使双机中的某个节点获得对外提供网络服务的资源。
当生产节点形成后,同时启动节点监控功能,对双机中的节点进行网络状态监控,保持网络状态的健康。
双机任务启动后,该模块启动任务监控功能,对所启动任务的关键进程进行监控。保障对外提供服务的资源健康。当以上资源建立起来后,双机系统进入正常运行状态。
ROSE高可用双机系统进入正常运行状态后,通过专用的通讯链路和双机中的其它节点进行通讯,传输各节点的状态信息,使各节点的核心管理模块获得整个双机节点的实时状态。
当系统中有节点故障时,双机管理模块根据双机当前的状态和该故障节点在双机中的角色做出双机系统是否重组。当该节点为生产机时,双机系统会自动将属于该节点的资源和任务移交到备份服务器上。保证该业务正常运行。
如果该节点为备份服务器,ROSE 双机软件对系统管理员提出报警后,将任务的移交进行封锁,该任务当前处于不可移交状态,直到备份服务器故障修复处理后,重新进入双机系统后,ROSE双机软件管理模块检查到该故障修复后,对当前的任务进行解锁操作。备份服务器在生产机出现故障的情况下,对任务及其资源进行接管。
五、rose支持的系统
Product Name |
Supported Platform |
Supported Application |
Rose for Windows |
Windows 2000 Server for x86
(Standard / Advanced / Datacenter Edition)
Windows 2003 Server for x86 / x86_64
(Standard / Advanced / Datacenter Edition) |
Microsoft SQL Server、Exchange 2000/2003、Oracle,user defined, etc |
Rose for Linux |
RedHat Enterprise Linux 2.1/3.0/4.0/5.0,SuSE Linux,Enterprise Server 9/10,TurboLinux Server 10 |
Oracle, MySQL, Sybase, DB2, NFS, Sendmail, Postfix,User defined, etc |
Rose for Solaris |
Solaris 8/9/10 for x86 / sparc |
Oracle, MySQL, Sybase, user defined,etc |
|