简单的说,集群(cluster)就是一组计算机,它们作为一个整体向用户提供一组网络资源。这些单个的计算机系统就是集群的节点(node)。一个理想的集群是,用户从来不会意识到集群系统底层的节点,在他/她们看来,集群是一个系统,而非多个计算机系统。并且集群系统的管理员可以随意增加和删改集群系统的节点。
集群并不是一个全新的概念,其实早在七十年代计算机厂商和研究机构就开始了对集群系统的研究和开发。由于主要用于科学工程计算,所以这些系统并不为大家所熟知。直到Linux集群的出现,集群的概念才得以广为传播。集群系统主要分为高可用(High Availability)集群,简称 HA 集群,和高性能计算(High Perfermance Computing)集群,简称 HPC 集群。
通过下面这篇文章我们可以方方面面了解 Linux 集群涉及的硬件和软件。
一般我们把集群系统分为两类:
- 高可用(High Availability)集群,简称HA集群。这类集群致力于提供高度可靠的服务。
- 高性能计算(High Perfermance Computing)集群,简称HPC集群。这类集群致力于提供单个计算机所不能提供的强大的计算能力。
在 Linux 出现前,集群系统采用的操作系统主要有 VMS、UNIX 和 WindowsNT。到九十年代末期,Linux 操作系统不断走向成熟,它的健壮性不断增强,并且提供了 GNU 软件和标准化的 PVM、MPI 消息传递机制,最重要的是 Linux 在普通 PC 机上提供了对高性能网络的支持,这样就大大推动了基于 Linux 的集群系统的普及和发展。