概念
集群是指一组相互独立的服务器在网络中表现为单一的系统,并以单一系统的模式加以管理。此单一系统提供了高可用性的服务。集群技术有许多特点,比如大多数模式下,集群中所有的计算机拥有一个共同的名称,集群内任一系统上运行的服务可被所有的网络客户所使用。集群必须可以协调管理各分离的组件的错误和失败,并可透明地向集群中加入组件。
一个集群包含多台(至少二台)拥有共享数据存储空间的服务器。任何一台服务器运行一个应用时,应用数据被存储在共享的数据空间内。每台服务器的操作系统和应用程序文件则存储在其各自的本地储存空间上。
集群内各节点服务器通过一内部局域网相互通信。当一台节点服务器发生故障时,这台服务器上所运行的应用程序将在另一节点服务器上被自动接管。当一个应用服务发生故障时,应用服务将被重新启动或被另一台服务器接管。
拓扑结构
有两种典型的拓扑结构可以实现高可用性集群,被动备份服务器和第二活动服务器。其中更为普遍的是活动第二服务器,它有三种实现形式:“全部复制”、“零共享”和“全部共享”。
被动备份服务器
通常把一个服务器安排为“主”服务器,一个服务器为“从”服务器;由主服务器为用户提供文件、打印及应用服务,从服务器只有在主服务器发生故障时才能投入运行,代替主服务器提供服务。在被动备份服务器方式下(如图1所示),除非主服务器发生故障,否则从服务器只是“观察”并不作任何运作。 |