现代企业的数据中心IT平台(包括主机平台、网络平台、存储平台等)的保护和恢复有不同等级的技术手段,未来企业的业务连续性建设将需要不断提高企业的信息、数据的保护和恢复的等级。
<?xml:namespace prefix = o ns = "urn:schemas-microsoft-com:office:office" />
不同层次的数据中心保护
如上图所示,对企业集中化数据中心的IT系统和业务数据进行保护可以有多种不同层次的保护方案,主要分为本地保护和远程保护两个方面。
企业数据中心面向运营的保护及恢复包括三个层次:
1) 平台保护—主要是平台的高可用,如采用主机群集系统和高可用存储平台(包括SAN网络环境的高可用和存储系统的高可用),保证IT平台没有单点故障,实现业务和应用的高可用性。
2) 数据备份—对业务数据进行经常性的本地备份,在IT系统出现物理故障或逻辑故障时,数据备份都能提供可靠的数据保护。
3) 数据恢复—在出现数据错误或丢失时能够进行快速、可预见的数据恢复,减少IT系统的中断时间,降低对业务运营的影响。
建设了完善的本地保护和恢复后,企业需要规划建设面向灾难保护及恢复的“远程”数据及业务保护,它包括三个层次:
1) 远程的信息保护—是将企业的所有重要数据安全的存储在远程站点,提供保护,避免灾难性的事件破坏数据。
2) 远程自动处理—除了提供对生产数据的远程保护外,能够自动进行系统切换、回切及数据恢复等工作,从而在灾难事件发生时能够快速恢复业务运行。
3) 多数据中心保护—通过建设多个数据中心,采用多数据中心的数据保护、恢复技术,防范更大范围的灾难事件。
容灾技术平台建设是企业业务连续性建设的重要基础。EMC公司将企业的IT平台划分为“接入平台、应用平台、数据平台”三部分,建议企业的容灾技术平台建设应该主要着眼于对业务处理平台,数据平台和接入平台这三个重要的系统领域的保护。
容灾技术模型示意图
2.2.1 业务平台的保护——业务处理能力的冗余
容灾技术方案建设中,对于企业的业务平台的保护,主要表现为对业务处理能力的冗余和复用,其中牵涉:
ü 支持应用系统运行的服务器和操作系统等系统软件
ü 支持应用系统运行的存储器及存储器和服务器的连接(存储网络等)
ü 连接服务器的IP网络系统
ü 支持应用系统实现的中间件或数据库等
客户将需要在容灾中心应该配置与需要保护的生产中心相同厂家、相同版本、相同配置的应用服务器、中间件和数据库。要确保主数据中心和容灾中心的软件运行环境相同。
ü 实现业务逻辑的应用软件系统
EMC咨询服务部门将可以为客户对上述各方面进行调查评估,分析客户的当前生产中心业务平台当前的现状和特定技术要求,并提出建设容灾方案的具体要求。
2.2.2 数据平台的保护——业务状态数据的复制
在容灾系统中,对数据平台的保护主要表现为对业务状态数据的保护、备份和恢复以及复制,需要保护的业务状态数据包括:
ü 业务交易状态(数据本身的数据属性为文件、数据库等)
ü 系统状态-包括应用软件的初始数据、参数设置、以及系统软件的配置数据、参数设置等。
ü 中间数据(或临时数据)
在容灾系统建设中,数据平台的保护是实现企业灾难恢复的核心。保证数据的安全永远是第一位的,只有支撑企业业务运营的数据能够及时、完整地复制到容灾中心,才可以在灾难发生时,在容灾中心恢复受灾难影响的业务应用。
对不同企业,EMC将根据需求分析的结果,对企业的不同重要级别的应用或业务单元采取不同的数据复制方法,对不同类型的应用,根据其访问特点等也将采取不同的数据复制方法。
接入平台在容灾备份系统里,需要实现对外部接口的冗余及切换,其中牵涉:
o 应用数据接口的切换-包括文件传输、消息机制等
o 应用连接接口的切换- HTTP连接、数据库连接、远过程调用、对象的调用等…
o 网络连接的冗余和切换 – 包括城域网网络连接、拨号连接等等…
企业的“接入平台冗余和切换”的关键在于实现在容灾中心应该配置相同访问能力的网络设备,并在网络配置上确保能快速、方便地将网络访问从主生产中心切换到备份生产中心
将根据项目启动前期的“现状评估、业务需求分析”等结果,可以从容灾层次、容灾范围、运营方式、容灾规模等多角度进行综合分析,得出适用于用户容灾要求的容灾模式和运营方式。
根据业务恢复时间的长短可以将容灾建设划分为不同的层次:
· 只做数据的灾难保护,仅能保证数据的完整性,此类业务在容灾中心只需要配置存储平台,实现数据的远程复制和存储即可。这种方式可以降低投资,但业务恢复时间很长(一般在3天以上)。数据的灾难保护是仅将生产中心的数据完整地复制到容灾中心的容灾方式。数据的灾难保护是异地容灾的最低级形式,也是最基本的方式,是实现更高级容灾方式的基础。
在灾难发生时,仅有数据的灾难保护无法保证业务的连续性,仅可以保证数据是可用的,若技术策略选择得当,可以保证业务数据的完整性。采用这种模式有以下特性:
√ 业务恢复速度较慢,通常情况下RTO>72小时
√ 业务恢复难度大,需要新增设备
√ 实现技术难度比较低
√ 运行维护成本较低
√ 投资比较节省
· 除数据的灾难保护外,实现应用的高可用,确保业务可以快速恢复。容灾系统的应用不改变原有的业务处理逻辑,是对生产中心系统的基本复制。这种方式有以下特性:
√ 业务恢复速度较快,通常情况下RTO小于24小时,也可以达到几小时级别
√ 业务恢复过程相对简单
√ 实现技术难度比较高
√ 运行维护成本较高,如:增加软件版本管理、软件部署、维护人员等
√ 投资比较高
根据业务影响分析结果,容灾备份存储平台项目的业务将划分为关键业务和非关键业务两大类。未来可以根据需要选择要做容灾保护的业务种类,可以先建设关键业务容灾,未来实现全业务容灾。
l 关键业务容灾:业务需求定义中通过业务影响分析定义关键业务的容灾
l 全业务容灾。
根据容灾中心配置的处理能力不同,可以分为同级容灾和降级容灾。若未来的在容灾中心为需要进行容灾保护的业务系统都配置与生产中心相同处理能力和高可用能力的业务处理平台(主要是指主机性能,高可用群集等),则为同级容灾设计。如果未来的在容灾中心为需要进行容灾保护的业务系统配置比生产中心的处理能力低或高可用能力降低(比如没有做群集等),则为降级容灾设计。采用同级或降级容灾方式取决于业务需求和投资预算,降级容灾可以减少投资(在主机方面的投资)。
该贴被wei.wang编辑于2013-9-6 14:15:57