容错服务器核心技术介绍
Lockstep Technology in ftServer Systems
Lockstep 技术简介
Stratus Continuous Processing ? 功能的基础是建立在时钟同步( lockstep )技术上的容错服务器体系结构。采用即使在故障出现,也可保证连续物种段处理的冗余部件来消除单点故障。许多 “ 强壮的 ” 服务器提供冗余的电源供给、风扇,和磁盘,然而只有 Stratus 可以提供对核心系统组件,包括母板、处理器、内存、 I/O 总线,和 I/O 适配器,的保护。
采用专利的 lockstep 技术, Stratus ftServer 系统保持多 CPU- 内存单元在精确的同步状态 — 在精确的同一时钟周期执行相同的指令。 Lockstep 处理确保任何错误 — 甚至瞬间错误 — 被消除,以及系统可以幸免于任何 CPU- 内存单元错误而不存在中断处理和任何数据或状态的丢失。
容错 I/O 系统物理上与 CPU- 内存系统分离。 ASIC 的硬件逻辑作为 CPU 和 I/O 间的 PCI 桥,同时提供核心错误监测、故障隔离、以及 lockstep 结构的同步逻辑。这些专利的 ASIC 分为 Stratus North PCI (SNP) ASIC 和 Stratus South PCI ( SSP ) ASIC 。 SNP 包含主 PCI 接口、中断控制单元,和交易排序逻辑。 SSP 包含表决逻辑、次 PCI 接口,及错误注册。借助以电缆,或底板形式实现的被动总线, ASIC 连接系统内的冗余 CPU 和 I/O 模块。
容错的 I/O 以冗余 I/O 总线、冗余的 I/O 适配器,和冗余的设备组成。对任何逻辑 I/O 操作,包括内部和外部存储操作,多路经都是可行的。任何 I/O 操作故障将引发操作重试,选择另一条路径确保 I/O 操作的成功完成。
Lockstep 技术

[1] [2]
|