|
知识路径: > 计算机系统知识 > 系统配置和方法 > 系统配置技术 > 系统配置方法(双份、双重、热备份、容错和群集) >
|
相关知识点:12个
|
|
|
|
企业在计划购买、部署引进高端系统时必须考虑到任何解决方案在计划内外的宕机成本,对于关键应用来说宕机所造成的损失甚至超过系统的直接购买成本!造成系统宕机的原因是多方面的,除了突发性的天灾人祸之外,计划内的维护和升级同样是造成停机时间的主要因素。计划内的停机并不意味着它们不应算作停机时间,任何时候的系统离线,都会使企业由于无法满足客户的要求而产生较大的损失。因此,尽最大可能减少计划内外的停机时间已成为关键业务领域追求的主要目标。研究系统配置的主要目的就是提高系统的可用性、鲁棒性,下面简单介绍几种常用的系统配置方法。
|
|
|
|
所谓双机热备援就是两台主机均为工作机,在正常情况下,两台工作机均为信息系统提供支持,并互相监视对方的运行情况,如下图所示。当一台主机出现异常时,不能支持信息系统正常运营,另一主机则主动接管(Take Over)异常机的工作,继续主持信息的运营,从而保证信息系统能够不间断的运行,而达到不停机的功能(Non-Stop),但正常运行主机的负载(Loading)会有所增加。此时必须尽快将异常机修复,以缩短故障时间。
|
|
|
|
|
|
|
(2)服务器没有宕机,但系统软件或应用软件工作不正常。
|
|
|
(3) SCSI卡损坏,造成服务器与磁盘阵列无法存取数据。
|
|
|
|
|
|
所谓双机热备份就是一台主机为工作机(Primary Server),另一台主机为备份机(Standy Server),如下图所示。在系统正常情况下,工作机为信息系统提供支持,备份机监视工作机的运行情况(工作机也同时监视备份机是否正常,有时备份机因某种原因出现异常,工作机可尽早通知系统管理员解决,确保下一次切换的可靠性)。当工作机出现异常,不能支持信息系统运营时,备份机主动接管(Take Over)工作机的工作,继续支持信息的运营,从而保证信息系统能够不间断地运行(Non-Stop)。宕工作机经过修复正常后,系统管理员通过管理命令或经由以人工或自动的方式将备份机的工作切换回工作机;也可以激活监视程序,监视备份机的运行情况,此时,原来的备份机就成了工作机,而原来的工作机就成了备份机。
|
|
|
|
|
|
|
|
对应用程序基础结构进行相应设计,将若干服务器集合为一个独立且统一的群集,可在用户或管理员无需知道群集中有多个服务器的情况下实现对计算负荷的共享,使服务器对用户和应用程序表现为虚拟统一计算资源,如下图所示。
|
|
|
|
|
群集系统中的各个服务器既是其他服务器的主系统,又是其他服务器的热备份系统。在某个服务器由于故障或计划停机而无法使用时,通过确保群集中其他服务器可以承担工作负载,群集服务器可以实现提高可用性的目标。此类群集可避免向访问该群集的用户或应用程序所提供服务的损失,还可透明进行服务器转移而不为用户所知。此外,可以使用群集增强可伸缩性。服务器群集可以在当前性能级别支持更多用户,或通过向多个服务器分散工作负载来提高当前数量的用户的应用程序性能。群集技术不同于双机热备技术,二者本质上的区别是能否实现并行处理和某节点失效后的应用程序的平滑接管。此外,双机热备技术只是在两台服务器上实现的。
|
|
|
|
①高可用性。使用群集服务,资源的所有权,如磁盘驱动器和IP地址将自动地从有故障的服务器上转到可用的服务器上。当群集中的系统或应用程序出现故障时,群集软件将在可用的服务器上重启失效的应用程序,或将失效节点上的工作分配到剩余的节点上。结果是用户只是觉得服务暂时停顿了一下。
|
|
|
②修复返回。当失效的服务器连回来时,群集服务将自动在群集中平衡负荷。
|
|
|
③易管理性。可以使用群集管理器来管理群集(如同在同一个群集中),并管理应用程序(就像它们运行在同一个服务器上)。可以通过拖放群集对象,在群集里的不同服务器移动应用程序。也可以通过同样的方式移动数据。可以通过这种方式来手工地平衡服务器负荷,卸载服务器,从而方便地进行维护。可以从网络的任意地方的节点和资源处,监视群集的状态。
|
|
|
④可扩展性。群集服务可进行调整,以满足不断增长的需求。当群集的整体负荷超过群集的实际能力时,可以添加额外的节点。
|
|
|
|
容错服务器目前已经开始大规模渗透到一些对服务器可靠性、可用性要求更为苛刻的行业,具有容错技术,能提供不间断服务的容错服务器正在冲击目前的双机热备和集群技术。
|
|
|
容错服务器是通过CPU时钟锁频,通过对系统中所有硬件的备份,包括CPU、内存和I/O总线等的冗余备份,通过系统内所有冗余部件的同步运行,实现真正意义上的容错。系统任何部件的故障都不会造成系统停顿和数据丢失。目前很多容错系统是基于IA架构的服务器,与Windows 2000完全兼容,实现以前只有在RISC系统上才能实现的容错。这种容错技术在IA服务器上的实现,将IA服务器的可靠性提高到了99.999%,同时服务器的运行是不间断的,也就是100%。
|
|
|
双机热备份和容错服务器的定位稍微有些不同,这是由两者实现的可用性差别决定的。双机热备份一般可以实现99.9%的可用性,容错服务器可以实现99.999%的可用性。这样,双机热备份大多应用在业务连续性不是很严格的行业,比如说公安系统、部队系统或者个别的制造企业,这些行业的应用允许数据有一小段时间的中断。而如交通、金融证券等要求高的行业则是容错服务器的天下了。
|
|
|
容错服务器是趋势,信息数据的爆炸性增长以及业务连续性的需求不断增加,都有力地证明容错服务器会是以后的一个发展趋势。双机备份方式由于需要至少2台服务器,导致在软件采购(操作系统、中间件、双机备份软件等)、软件维护升级、系统硬件升级都需要比单机容错方式多1倍的额外投入,而且在双机备份软件出现故障后,其维修的难度是业界众所周知的,对客户和代理商都会带来很大的困难。因此虽然单机容错服务器的硬件成本高于双机备份方式的硬件投入,其总成本(TCO)却远远低于双机备份方式的成本。
|
|
|