|
|
GPFS系统介绍
1.1 GPFS 介绍
GPFS 是 IBM 公司第一个共享文件系统,起源于 IBM SP 系统上使用的虚拟共享磁盘技术( VSD )。作为这项技术的核心, GPFS 是一个并行的磁盘文件系统,它保证在资源组内的 所有节点可以并行访问整个文件系统;而且针对此文件系统的服务操作,可以同时安全地在 使用此文件系统的多个节点上实现。 GPFS 允许客户共享文件,而这些文件可能分布在不同节点的不同硬盘上;它提供了许多标 转的 UNIX 文件系统接口,允许应用不需修改或者重新编辑就可以在其上运行。 GPFS 也支持 UNIX 文件系统的工具,即:用户可以像使用普通文件系统一样使用基于 GPFS 的文件系统, 唯一不同的在于管理 GPFS 文件系统的命令。 GPFS 提供的文件系统操作服务可以支持并行应用和串行应用,它允许任何节点(这些节点 属于同一个节点组)上的并行应用同时访问同一个文件或者不同的文件。
1.1.2 GPFS 优势
当 GPFS 文件系统与 Linux 群集结合使用时,将提供如下很多优势: 提高系统性能
GPFS 允许在同一 nodeset 内的多进程或者应用使用标准文件系统调用,同时访问(并发 读写)同一个文件。通过将 nodeset 内读写操作分布到多个磁盘上,大大增加了文件系统的 带宽;通过整个系统的负载均衡避免了某个磁盘过大的读写。
数据一致性
GPFS 通过一套复杂的信令管理机制提供数据一致性;通过这套机制允许任意节点通过 各自独立的路径到达同一个文件。即使节点无法正常工作, GPFS 也可以找到其它的路径。
数据安全性
GPFS 是一种日志文件系统,为不同节点建立各自独立的日志。日志种记录 metadata 的分 布,一旦节点发生故障后,可以保证快速恢复数据。
GPFS fail-over 功能通过规划,将数据分布到不同 failure group 内达到高可用性,减少单 点故障的影响。为了保证数据可用性, GPFS 在多个 failure group 内为每个数据实例做备份, 即使创建文件系统时没有要求复制, GPFS 也会自动在不同的 failure group 内复制恢复日志。
系统可扩展性
通过 GPFS ,系统资源可以动态调整;可以在文件系统挂载情况下添加或者删除硬盘。 统处于相对空闲时,用户可以在已配置的硬盘上重新均衡文件系统以提高吞吐量。 可以在不重新启动 GPFS 服务情况下添加新节点。
管理简单
GPFS 自动在各个节点间同步配置文件和文件系统信息,而且在同一个 nodeset 内,对GPFS 的管理可以在任一个节点上进行。 1.2 GPFS 工作原理 
如上图所示, GPFS 系统架构主要由一下组建构成:
GPFS kernel module extension
Portability Layer module
RSCT daemon
GPFS daemon1.2.1 The GPFS kernel module extension (mmfs) 核心扩展模块提供与 Linux 核心中 VFS (虚拟文件系统)的接口。通过此模块,对 GPFS 文 件系统的操作就像对普通文件系统一样。
1.2.2 GPFS daemon (mmfsd)
GPFS 守护进程是 GPFS 文件系统的核心进程,它保证所有的输入输出操作和缓冲区管理的正常。
GPFS 守护进程是一个多线程进程 , 其中很多线程专门提供特定的服务这样保证大量请求发生时 , 不会发生阻塞。
GPFS 守护进程还负责与其它节点的 GPFS 守护进程通信,来保证数据的一致性。
[1] [2] [3]
|
|