Linux 上的高可用性
SteelEye公司的产品LifeKeeper for Linux是一个通过保持系统正常运行而确保应用具有持续可用性的软件。LifeKeeper实现以集群方式连接在一起的Linux系统的高可用性,这是通过监控系统及应用的健康状态、保持客户连接性并为任何客户–无论位于互联网、内联网还是外联网提供不间断的数据访问。
为了使系统及应用能在宕机时自动恢复,LifeKeeper允许将应用在发生错误时切换到集群中的其他服务器上。这有助于LifeKeeper将单点故障的风险降到最低,从而在Linux系统上创建一种抗错环境以满足关键任务操作的严格可用性要求。
抗错
LifeKeeper为Linux 环境提供抗错 (FaultResilience,FT) ,这是通过允许同一集群内的其他服务器接管失效的服务器和失效的应用。总拥有成本的降低是因为LifeKeeper支持服务器的 Active/Active配置。该种模式下不再需要专门购买用作热备份的服务器,从而允许客户和应用在失效时恢复到集群中正在运行其他应用的服务器上。
前瞻性保护
有了LifeKeeper,某个硬件部件或应用的失效可通过多种错误检测机制被提前检测出来而不会等到系统完全失效。LifeKeeper 使用智能的进程和多条LAN心跳连接来监控Linux 集群。在两台服务器节点之间定时发送额外信号而确定系统和应用的健康状态 ,LifeKeeper在采取任何行动前首先确认系统状态,这降低了单点故障的风险,使故障切换情况最少发生。当应用失效但硬件仍能正常工作时,LifeKeeper首先只恢复失败的应用而不会马上完全切换到另一台服务器,限制了不必要的切换。
透明的故障切换
如果因为某个事件的发生而导致服务器可用性的中断,LifeKeeper自动将保护的资源和应用转移到集群中的另一台服务器上。因为切换过程对客户端是透明的,单个系统的失效不影响用户的工作。 LifeKeeper 迁移所有的应用和传输连接性的方式使用户能够继续访问应用和数据。这保证所有客户–从内部用户到在线客户–都不会受到系统失败的影响。
伸缩性
LifeKeeper提供一个集群框架,允许通过简单地往集群中增加节点而使应用支持更多的用户。为了确信提供失效保护,LifeKeeper还在应用级支持伸缩性。当LifeKeeper以多向配置安装时,某台机器上的多个失效应用可以恢复到不同的机器。
数据访问与完整性
当LifeKeeper运行于共享存储环境下,数据存储是与集群中的服务器分开的。所有数据保存在外部共享磁盘中。这种独立性允许在访问数据时不必考虑是通过哪台主机上的应用,而且LifeKeeper的共享存储锁定机制通过对磁盘的锁定使其在任何时刻只允许一个应用存取,维护了数据的完整性。
恢复操作
LifeKeeper为Linux环境提供保护,支持容灾、多系统失败恢复以及更快速的恢复,这包括:多向恢复:LifeKeeper for Linux 支持一种多向故障切换配置的四节点集群,其中相关的两个节点连接到同一共享磁盘。
支持共享数据:LifeKeeper for Linux支持N+1配置。LifeKeeper 在每条共享SCSI总线上支持两个节点。这允许在集群中连接到同一共享磁盘的两个节点之间实现基于共享SCSI磁盘的应用恢复。在该配置下的服务器扮演Active/Active角色,为集群中的任何其它节点提供故障备份
多级失效切换:LifeKeeper for Linux允许在最多32个活动节点之间实现多级故障切换,保证在发生系统或应用失败时客户能够继续访问。
应用恢复工具包 (ARK)
SteelEye为商业软件提供LifeKeeper应用恢复工具包,包括数据库、Web服务器和应用服务器。这些应用恢复工具包提供LifeKeeper管理和控制某个特定应用的工具。当安装了特定应用恢复工具包后, LifeKeeper就能监控该应用的健康状态并在其失败时进行自动恢复/切换。
SteelEye同时还提供应用恢复软件开发工具包 (SDK) ,支持开发特定的应用恢复工具包。应用恢复 SDK为开发用于专门应用以及商业应用服务器的定制恢复例程提供强大的框架。使用了SteelEye的应用恢复 SDK,特殊的恢复例程可以通过编写直接的应用恢复脚本而定义。
在维护与升级时仍然保证运行
LifeKeeper允许在计划停机维护或升级期间以及在系统失败或应用停止响应时保证系统的运作。 LifeKeeper的抗错能力可用于方便系统或应用升级。有了LifeKeeper,一般用于日常维护或升级的停机时间可以大大减少甚至消除
Linux:
IP Recovery Kit
Raw I/O Recovery Kit
CCISS Support
提供应用层面的集群功能、支持流行应用
提供支持共享存储和扩展镜像两种方式
一个集群中可以支持三十二台服务器并且和服务器的硬件配置无关
支持Windows和SQL Server的各种版本
提供多种保护和切换方式
支持各种流行应用
实时监控应用的运行状况
提供应用层面的集群功能
总结:
LifeKeeper是一个运行多年成熟、可靠的产品,尤其在Linux平台上的版本目前是业界最好的方案
LifeKeeper为主流应用提供高可用性; 不干扰应用运行,无需修改应用
开放的应用保护机制,便于用户针对自己的应用提供保护
数据复制提供优化的性价比,实现可伸缩的解决方案
LifeKeeper提供直观的基Java的图形接口,方便实现跨平台配置、管理和状态监控; 同时也包括一个完整的命令行接口
|