★我要吧★

 找回密码
 注册[Register]
搜索
qq空间相册密码查看为什么登陆后需要激活无法注册?

双机容错与集群术语详解 > 双机容错

[复制链接]
发表于 2012-1-14 17:24:02 | 显示全部楼层 |阅读模式
随着计算机应用的深入,企业对计算机系统的依赖程度也日渐增加。在这些行业性关键业务处理系统中,服务器端保存有大量关键业务数据,一旦信息发生丢失或破坏,将带来灾难性的影响和损失。双机容错目的在于保证数据永不丢失和系统永不停机(Non-stop)。双机容错系统通过软硬件的紧密配合,将两台独立服务器在网络中表现为单一的系统,提供给客户一套具有单点故障容错能力,且性价比优越的用户应用系统运行平台。

  双机容错是为了保障服务器工作不间断运行而出现的,简单的说,是两种功能的综合:监控功能和切换功能,其基本工作原理是服务器间通过软件监控服务器的CPU或应用,并互相不断发出信号。当某服务器发生中断,其它服务器接收不到其发出一信号时,软件的切换功能发生作用,将中断服务器的工作在指定服务器上启动起来,使服务器的工作得以继续。 双机容错实际上是集群容错的特例,双机指两台服务器间,集群指多台服务器间,两者区别主要在于服务器数据数量的不同。

  要分析为什么采用双机容错,首先应先了解为什么服务器会发生停顿。服务器停顿原因大致可分为7类;按计划的硬件、操作系统进行维护,如增加硬盘、安装操作系统补丁等;应用失效,如数据库出错等;操作员出错,如误操作等人为错误;操作系统故障,如操作系统死机等;硬件故障,如硬盘、网卡损坏等;断电(没有UPS的情况);自然灾害,如火灾、地震、洪水等。从上面的说明可以看出,在停顿原因中软件的因素占到了绝大多数,而硬件原因只占其中的以小部分原因,这就是为什么说可以监控应用的容错软件有着比监控硬件的热备份软件更好的性能的原因。操作员出错即人为错误,使用纯软件方式可以部分消除该错误,如误关机、操作系统文件的误删除等,因为数据是分别存储于不同服务器上,所以对于没有损伤到复制文件的误操作不会产生影响的。对于硬件故障,共享磁盘阵列柜的热备份软件虽然对硬件进行监控但也只能部分消除,而热备份软件主要是对CPU的监控,对于如磁盘阵列柜的错误、磁盘的损坏等无能为力,但纯软件方式可以做到。对于断电(没有UPS的情况),纯软件方式可以部分解决,因为这种方式的服务器之间有距离,只要不是同时断电就可以解决。自然灾害可以用纯软件方式部分解决,同样是因为服务器之间有距离,如火灾等。

  双机容错与集群技术提供了比磁盘阵列更好的性能以及更多的功能。当一台主机出现故障,可及时启动另一台主机接替原主机任务,保证了用户数据的可靠性和系统的持续运行,它主要是解决的问题是保持计算机应用软件系统的连续运作。对于一些柜台业务系统,大数据量连续处理系统来说,这种数据管理是必不可少的。

  目前,这项技术已在各行各业得到广泛的应用。
您需要登录后才可以回帖 登录 | 注册[Register]

本版积分规则

QQ|手机版|小黑屋|☆我要吧☆ ( 豫ICP备13016831号-1 )

GMT+8, 2024-12-26 23:18 , Processed in 0.057150 second(s), 18 queries .

Powered by abc369 X3.4

© 2001-2023 abc369.

快速回复 返回顶部 返回列表