在卷镜像建立后,主服务器和从服务器上的驱动器已经同步,并且两个服务器都已启动运行,出现下面的事件:
最初的镜像建立后,系统禁止所有用户存取从镜像卷,不允许对从服务器上的镜像卷读和写。主服务器镜像则可以进行读和写操作。
到达主服务器的所有镜像和非镜像卷的读操作被传递给卷后, 可以无干扰的正常完成。对从服务器上镜像卷不能以 Standby 模式读,例如,从服务器尚未承担主服务器发生故障时的角色。
无论何时主服务器收到一个写请求,系统首先决定这个请求是否针对某个镜像卷。如果不是,写操作可以完全正常的完成。如果主服务器写请求是针对镜像卷的,那么请求首先被送到从镜像卷去。从系统在自己的镜像卷上执行写请求后,向主系统发送写回状态。主服务器在收到这个写回状态前不做任何写操作。
当从系统返回一个成功状态时,主系统在自己的镜像卷执行写操作,并返回到请求方。如果从系统执行镜像卷写操作时发生错误,那么从系统上的写操作将被中止,主系统结束自己的镜像卷写请求,镜像状态从 Normal 变为 Broken 。
STEELEYE LifeKeeper with Extended Mirroring 特性
STEELEYE LifeKeeper For Windows 与 STEELEYE 扩展镜像软件互有优点,两者的结合给用户提供了不少好处。
STEELEYE LifeKeeper For Windows 的自动检测与恢复功能和 STEELEYE 扩展镜像软件的卷镜像功能相辅相成,使 STEELEYE LifeKeeper 系统配置中,无需昂贵的 RAID 磁盘子系统。
使用扩展镜像的 LifeKeeper 由于数据被镜像到另一个系统上去,因此 STEELEYE LifeKeeper For Windows 与 STEELEYE 扩展镜像软件的结合去除了 RAID 磁盘子系统中单点故障的可能性。
因为没有共享 SCSI 缆线的长度限制, STEELEYE 扩展镜像软件使用户能够将 LifeKeeper 服务器放置在局域网上任意处,这使带有 STEELEYE 扩展镜像功能的 STEELEYE Lifekeeper For Windows 有可能在独立楼房中通过对服务器的定位来达到灾难恢复的目的。
STEELEYE LifeKeeper with Extended Mirroring 配置示范

使用带有 STEELEYE 扩展镜像功能的 STEELEYE LifeKeeper for Windows 来进行配置,其中 Server1 是主服器, Server2 是从服务器。当一个客户向 Server1 上的镜像卷发出写命令, STEELEYE 扩展镜像软件保证写命令通过网络送给 Server2 , Server2 上的写操作成功完成时, Server1 上的写操作才能完成。因此,两处系统能够同时更新,因此主、从服务镜像卷中的数据一致性得以保证。
软件、硬件配置
1 、软件: STEELEYE LifeKeeper 及 Recovery Kit
2 、硬件:服务器可以是任何 IEL 基础上的平台 , 两台 Server 的型号 , 配置不必一致 , 只需硬件平台能保证运行
1 、 STEELEYE LifeKeeper with Extended Mirroring 运行机制
I 、通讯路径
“ Heartbeat ”是服务器间发出的周期性检测信息,它允许 STEELEYE Lifekeeper For Windows 决定服务器的状态。当一个服务器向另一处服务器发送一个“ Heartbeat ”消息,并且在规定时间段里没有得到任何回应时, 发送消息的服务器开始评测接收消息的服务器是否正在发生故障。多种“ Heartbeat ”检测信号保证故障检测的可靠性,以防止不必要的资源服务切换。 STEELEYE LifeKeeper For Windows 为 STEELEYE 扩展镜像提供下列途径上的“ Heartbeat ”通信:
Socket ( TCP/IP )
RS-232 TTY 通信端口( Communications port )
STEELEYE 扩展镜像软件消除了共享 SCSI 的需要。
II 、主服务器发生故障
客户向 Server1 上运行的一个程序发送一个请求,而 Server1 出现写错误时,使用带有 STEELEYE 扩展镜像功能的 STEELEYE Lifekeeper For Windows 能够检测出系统失败。然后, STEELEYE LifeKeeper For Windows 执行恢复规则,试图关闭 Server1 上的应用,并且在 Server2 上重新启动它们。 Server2 现在承担主服务器的角色,镜像卷地址从 Server1 转移到 Server2 上去,这个转换过程对用户来说是透明的,客户一般不会发现系统曾经发生这样的故障。
一旦系统发生的故障被被纠正过来,管理员必须重新同步镜像卷。重新同步这些卷并被锁定,目的是不接受任何客户的存取。在这个过程中,非镜像应用不会受到影响,因此这些应用可以毫无干扰的继续运行。系统管理员可以选择何时对镜像卷进行同步,通过提供选择时间的灵活性达到对整个系统的影响减为最小。
重新同步主服务器和从服务器上镜像的时间依赖于卷的大小。 一般情况下,在 100MB 以太网上, 恢复 1Gigabyte ( GB )的数据只需要 10 分钟。
III 、从服务器发生故障
当从系统发生故障时,受影响的镜像卷标志为 Broken 。有必要纠正这些故障,并重新同步有关的卷。当从系统发生故障时,任何写请求不会送给从系统。当从服务器发生故障后再次恢复时,扩展镜像管理器用来重新同步主镜像卷和从镜像卷。
2 、工作方式
I 、 Active/Standby
[ 1 ] [ 2 ] [ 3 ] [ 4 ] [ 5 ] |
|
|