|
知识路径: > 计算机系统综合知识 > 系统配置与性能评价 > 可靠性设计 >
|
考试要求:掌握
相关知识点:6个
|
|
|
|
实现容错的主要手段就是冗余。冗余是指所有对于实现系统规定功能来说是多余的那部分的资源,包括硬件、软件、信息和时间。通过冗余资源的加入,可以使系统的可靠性得到较大的提高。主要的冗余技术包括结构冗余、信息冗余、时间冗余、冗余附加四种。
|
|
|
|
结构冗余是常用的冗余技术,按其工作方式,可分为静态冗余、动态冗余和混合冗余三种。
|
|
|
(1)静态冗余。常用的有三模冗余和多模冗余。静态冗余通过表决和比较来屏蔽系统中出现的错误。例如,三模冗余是对三个功能相同,但由不同的人采用不同的方法开发出的模块的运行结果进行表决,以多数结果作为系统的最终结果。即如果模块中有一个出错,这个错误能够被其他模块的正确结果“屏蔽”。由于无需对错误进行特别的测试,也不必进行模块的切换就能实现容错,故称为静态容错。
|
|
|
(2)动态冗余。动态冗余的主要方式是多重模块待机储备,当系统检测到某工作模块出现错误时,就用一个备用的模块来顶替它并重新运行。这里须有检测、切换和恢复过程,故称其为动态冗余。每当一个出错模块被其备用模块顶替后,冗余系统相当于进行了一次重构。各备用模块在其待机时,可与主模块一样工作,也可不工作。前者叫做热备份系统(双重系统),后者叫做冷备份系统(双工系统、双份系统)。在热备份系统中,两套系统同时、同步运行,当联机子系统检测到错误时,退出服务进行检修,而由热备份子系统接替工作,备用模块在待机过程中其失效率为0;处于冷备份的子系统平时停机或者运行与联机系统无关的运算,当联机子系统产生故障时,人工或自动进行切换,使冷备份系统成为联机系统。在运行冷备份时,不能保证从程序端点处精确地连续工作,因为备份机不能取得原来的机器上当前运行的全部数据。
|
|
|
|
|
在实现正常功能所需要的信息外,再添加一些信息,以保证运行结果正确性的方法。例如,纠错码就是信息冗余的例子。
|
|
|
|
使用附加一定时间的方法来完成系统功能。这些附加的时间主要用在故障检测、复查或故障屏蔽上。时间冗余以重复执行指令(指令复执)或程序(程序复算)来消除瞬时错误带来的影响。
|
|
|
|
指为实现上述冗余技术所需的资源和技术,包括程序、指令、数据、存放和调动他们的空间和通道等。
|
|
|
系统一旦发生故障,就需要采用某种方法进行恢复。故障的恢复策略一般有两种,分别是前向恢复和后向恢复。前向恢复是指使当前的计算继续下去,把系统恢复成连贯的正确状态,弥补当前状态的不连贯情况,这需要有错误的详细说明;后向恢复是指系统恢复到前一个正确状态,继续执行,这种方法显然不适合实时处理场合。
|
|
|