高可用集群解决方案简介:

什么是高可用集群系统:
集群技术是将多台服务器联在一起,组成一个透明的系统,这些服务器之间互相共享资源,如IP、数据或应用软件等。对最终用户来说,可把这个集群系统当作一个虚拟的服务器来使用。当集群中的某台服务器由于软件或硬件原因发生故障时,集群系统可以把IP、应用软件等资源切换到其他健康的服务器上,即另外的服务器可立即取代该故障机的职责,继续为用户提供服务,使整个系统能连续不间断的对外提供服务,从而为企业24x365的关键业务提供了可靠的保障。
导入高可用集群系统的效果
:
通过集群技术的运用,可以为用户带来如下好处:
高可靠性
保证集群系统上的关键数据和业务的运行连续性及可被访问。
高可用性(Availability)
缩短系统故障的平均修复时间,减低系统故障带来的恶劣影响和经济损失。
高扩展性(Scalability)
集群系统可根据业务需求灵活增加服务器节点,从而提高了集群的处理性能。
减低客户端/服务器架构的系统维护成本;
避免单点故障。
NEC ExpressCluster产品概要磁盘结构
ExpressCluster for Linux Ver3.1既可以使用本地磁盘来构筑纯软件的镜像型集群系统,也可以使用专门的共享磁盘装置来构筑大规模的共享磁盘型集群系统,充分满足了客户的不同需求。

共享磁盘系统:
集群各服务器之间共享磁盘阵列设备。当活动服务器发生故障时,待机服务器将使用共享磁盘上的数据来继承业务。通过使用共享磁盘,覆盖数据量可达到TB级。
镜像磁盘系统:
通过专用高速网络(私网)对集群服务器上的数据磁盘进行镜像化。当活动服务器发生故障时,待机服务器使用镜像盘上的数据来继承业务。适合于数据容量为数十到数百GB的系统。
故障监视集群系统对服务器上发生的各种故障进行监视,发生故障时将业务转移到其他服务器上(失效切换)。NEC ExpressCluster可监视以下故障:
- 服务器关机/切断电源 AP或服务停止失效切资源(如Public LAN)查出异常
ExpressCluster服务器模块本身的异常等。
失效切换资源在ExpressCluster中,包含在失效切换组中的资源主要有以下几种:
镜像磁盘/切换分区
应用程序为保存继承数据所用的磁盘分区。
IP地址(即浮动IP)
通过使用浮动IP地址与业务进行连接,使客户端无须注意失效切换引起的业务执行位置(服务器)的变化。
应用程序(脚本)通过脚本启动业务应用程序。
运行形态ExpressCluster for Linux Ver2.1为用户提供了单方向、多方向都3种不同的待机方式,如下所示:
单方向待机(Active/Passive)
一端服务器为当前运行服务器,用来运行业务,而其他服务器为待机服务器,不运行业务。这是一种最简单的使用形态,可以构筑高可用性系统,保证失效切换后不会出现性能下降。

同一AP的双方向待机(Active/Active)
运行跨多个服务器的业务应用程序,相互进行待机。

不同AP的双方向Standby(Active/Active)
在不同服务器上运行类型不同的业务应用程序,相互进行待机。

ExpressCluster关键技术特点
ExpressCluster以下几方面的关键技术,为用户的关键业务系统提供强大的高可用性、高可靠性和灵活的扩展性。
支持多平台
ExpressCluster支持目前国内几乎所有主流的Windows和Linux操作系统平台,如Windows NT/20002003,RedHat,Turbolinux,MIRACLELINUX,Novell SUSE LINUX,RedFlag等。
支持IA-64和EM64T等64位架构的服务器和操作系统平台
自动监测
ExpressCluster可自动检测和恢复服务器和应用程序的故障,不仅可以监视服务器故障,还可以监视IP地址、磁盘设备、用户应用程序等等各种资源的故障。当检测出故障时,ExpressCluster能根据事先制定的切换策略,自动把应用程序和其他故障资源以失效切换组为单位切换到其他的服务器上,并继续正常地对外提供服务。
多种心跳监测方式
提供网卡(公网/私网)、COM(RS-232C)、磁盘心跳这3种心跳方式,更加提高了集群系统的可靠性。
ExpressCluster不仅可以监控硬件故障,还可以监控软件和操作系统故障。
支持多达4种的集群工作模式,客户可根据系统需求,任意配置单活(Active/Standby)、双活 (Active/Active)、N+1备份以及N备份这4种集群工作方式,极大满足客户的业务配置要求。
支持多种存储技术(SCSI,RAID,IDE,Fibre Channel,SAN等)。
在镜像解决方案中,提供ExpressCluster FastSync Option模块(即差分备份模块),可直接对2台服务器的镜像盘中的差分数据进行恢复,而不必通过全盘Copy来做恢复,大幅缩短了镜像恢复所需的时间,提高了镜像恢复的性能。
简单易用的图形用户接口,轻松管理集群系统;
除了GUI管理工具外,还提供了基于Web浏览器的状态监视服务,用户在任何一台机器上访问集群的虚拟IP地址即可监视集群的运行状况;
通过编辑Group中的脚本,即可轻松实现应用程序的切换;
提供操作简便的Script Wizard,让用户轻松配置脚本;
除了对应用程序和服务的常规级别的监视外(所谓常规监视即进程死活级别的监视),
ExpressCluster还提供了一系列监视选项产品,如Database Agent,Internet Server Agent, LAN Agent, File Server Agent等,这些监视选项产品可对ExpressCluster上运行的数据库等应用程序和服务的僵死状态(Stall)进行监视,从而为用户的关键业务系统提供了更深层次的保护。
IPTV系统结构示意图

IPTV高可用环境
全省十多个地市全部应用NEC高可用性解决方案100套ExpressCluster加固应用系统? RedHat Linux AS 3.0
保护MySQL数据库+IPTV运营系统
基于Linux系统的镜像型+共享型集群系统
提高系统高可用性,降低系统运营风险
系统可用性和可靠性达到为99.99%
产品概要在复杂化、高功能化的现代IT社会,服务器宕机所产生的影响和损失是无法估量的,由此产生的对服务器系统的高可靠性和高可用性的要求也越来越高。由于初期投资等原因,企业一般只对重要的单服务器进行高可用设置,对于高可用性的需求也从原来的以主干系统(多机集群系统)为中心,正在向单一的部门服务器、店铺服务器(单机系统)方面扩展。因此,单机系统的高可用性也日益重要起来。
ExpressCluster SingleServerSafe(以下简称SSS)依据市场的需求,将ExpressCluster的故障诊断、故障恢复技术应用在在单机系统中,能够很方便地实现单机系统的高可用性。

功能特性SSS对单机系统进行软硬件的监控,当发生故障时,通过进行系统的恢复处理,来实现高可用性。
监视功能
硬件监控(NIC监控,磁盘监控)
软件监控(OS监控,服务/进程监控,用户应用程序监控)
恢复功能
服务器的重新启动,软件的重新启动
