红联Linux门户
Linux帮助

UNIX平台廉价双机容错方案完全解决措施

发布时间:2006-02-16 10:07:51来源:红联作者:koov
  由于有多种方式来提高系统的可用性,但每种方式又各有利弊,因此设计者往往需根据用户的实际可靠性与可用性的要求选择不同的解决方案。这也取决于系统的需求:硬件的容错方案往往运行速度较快但投资规模也大,软件容错方案可能占用系统开销,但比硬件方案更灵活,尤其是在系统已经建立起来之后,并且投资小。本文所介绍的容错系统就是利用浪潮英信服务器可靠性平台和Western Micro的专用技术,通过软件方式,而不借助阵列柜或其它专用硬件来实现系统容错,达到提高系统可用性的目的。
  
  设备选型
  在本方案中,我们使用浪潮英信服务器----网通NL300,这是因为该款服务器具有如下鲜明的特点,特别是在可靠性、性能、扩展性方面都有出色的表现:
  
  采用最新的Intel Pentium Ⅲ Xeon处理器,性能出色,可靠性高,可扩展性强。同时采用业界先进的系统体系结构,包括133MHz SDRAM、64-bit/66MHz PCI、和最新的FSB为133MHz的Intel Pentium Ⅲ Xeon处理器,提供了两路服务器所能提供的超强性能。
  
  除了超强的性能以外,为了保护用户的投资,使得服务器能够随着用户业务的增长而不断的提升性能,网通NL300预留了充足的内部扩展能力:系统一共以提供16个存储槽位,其中包括9个热插拔硬盘槽位,满足用户不断增长的存储要求;系统提供了6个PCI插槽和一个ISA插槽,并且支持最新的64位PCI技术,可以安装高性能的扩展卡,满足您不断提升的性能要求;另外,内存可以扩展到4GB,并支持两路处理器。最大限度的保护投资。
  
  此外,为了保证用户关键业务的稳定运行,网通NL300提供了极高的可用性,包括ECC内存、热插拔硬盘、热插拔电源和故障预测技术。拥有了以前高端计算机才拥有的特性。
  
  系统平台
  浪潮网通NL300服务器两台(可以是不同配置,配置双网卡);
  SCO UNIX操作系统两套;
  数据库系统一套;
  SavWareHA软件一套;
  RS232串口线、CAT5类直连(NO HUB)网线各一根。
  
  通过上图我们可清楚地看到两台服务器各自配备双网卡,它们各自通过其中一块网卡接入公共网络,通过这个连接向网络中的其他客户提供服务。而另一对网卡用于它们之间的互连,这条通道就是在两台服务器之间进行大量数据传送的专用通道,它负责两台主机之间同步数据的传送工作;而串口线在两台机器之间传递心跳信号,用于检测服务器的状态,以判断是否进行业务以及主机地址的接管。
  
  系统工作过程
  1) 自动侦测(Auto-Detect)阶段:
  由服务器上的软件通过侦测线,经由复杂的监听程序。逻辑判断,来相互侦测对方运行的情况,所检查的项目有:
  服务器硬件(CPU和周边);
  服务器网络;
  服务器操作系统;
  数据库引擎及其它应用程序;
  为确保侦测的正确性,而防止错误的判断,可设定安全侦测时间,包括侦测时间间隔,侦测次数以调整安全系数,并且由服务器之间的专用通信连线,将所汇集的讯息记录下来,以供维护参考。
  
  2) 自动切换(Auto-Switch)阶段:
  如果备机确认对方故障,则它除继续进行原来的任务,还将依据各种容错备援模式接管预先设定的备援作业程序,并进行后续的程序及服务。
  
  3) 自动恢复(Auto-Recovery)阶段:
  在备机代替故障主机工作后,故障服务器可离线进行修复工作。在故障修复后,透过专用通讯线与备机连线,自动切换回修复完成的服务器上。整个回复过程完全可由SavWareHA自动完成,亦可依据预先配置,选择回复动作为半自动或不回复。
  
  方案特点
  本方案充分利用容错系统的特点,为用户提供一种在SCO平台下不依赖于外加磁盘阵列柜的纯软件高可用性系统。它可以通过网络连接在两台服务器之间实现数据的实时备份,同时又采用一些监控手段,当主服务器发生故障时可以把业务切换到备份服务器上使用,从而真正实现系统容错,保证系统的高可靠运作。
  
  面是其主要特点:
  1) 专业设计的硬件平台----浪潮网通NL300服务器,采用对称多处理器、ECC 内存、冗余热拔插电源、热拔插硬盘、冗余风扇等,提高了单机系统的可用性;
  2) 自动实时对数据进行镜像,自动监测工作主机的状态,并自动对错误的发生作出相应处理;
  3) 故障应用自动切换功能,可通过监控业务的运行情况,一旦发现业务运行出错,能够自动切换业务运作服务器;切换发生时,备份服务器自动接管原来服务器的用户连接、数据库进程、应用进程等,无需人工干预;
  4) 方便的用户管理界面,灵活的管理方式,通过预留程序接口,方便用户自行定义监控的项目,自定义切换前后,将自动执行的关闭进程指令集合及启动进程指令集合;
  5) 支持手工切换。用户可以随时将系统的控制权在两台主机之间切换;
  6) 支持真正的在线连接与分离(两台主机通过网络连接,可以支持带电的连接与分离),利于用户的系统维护等操作;
  7) 系统具有极高的工作效率和广泛的应用,这是因为,它只与SCO UNIX操作系统紧密联系,与数据库及应用无关,因而它可以支持各种数据库(包括ORACLE、Sybase、Informix等),和用户在其上开发的各种应用;
  8) 与用户的应用系统无关,用户可以不加修改地使用他们的应用;
  
  结束语
  本方案充分考虑中小型企业以及金融、电信、铁路、证券的一些基层单位。通过利用对重要数据的镜像,以及用户应用程序运行主机的自动切换功能,为重要业务的运作提供有力的保障;而纯软件的方式,又可节约大量资金投入。
文章评论

共有 1 条评论

  1. kinron 于 2009-12-11 13:00:17发表:

    方案不错。支持下~