容错系统中的自校验技术及实现方法
-
-
news
2006-01-08
摘 要: 阐述了自校验技术在容错系统中的作用,给出了自校验网络实现原理及实现方法,指出用VHDL语言结合FPGA/CPLD是实现大规模自校验网络的有效途径。
关键词: 容错 自校验 完全自校验 VHDL FPGA/CPLD
容错是容忍错误的简称,容错系统是指在发生硬件故障或存在软件错误的情况下,仍能继续正确完成指定任务的系统。设计与分析容错系统的各种技术称为容错技术。有关计算机容错技术的各种理论及研究已经发展成为计算机学科的一个重要分支,称为容错计算(Fault-tolerant Computing)。设计容错系统的指导思想是:系统发生故障时能自动检出并使系统自动恢复正常运行。
为保证系统具有高可靠、长寿命和响应迅速,必须采用容错技术。从功能上讲,一个容错系统可用图1所示框图来描述,系统模块可由若干个功能相同的子模块并联组成,故障检测模块对系统模块的功能进行检测,检测到故障后由故障处理模块对系统模块进行重新配置,使系统在部分模块失效的情况下,仍能输出正确结果。在这个系统中,故障检测模块和故障处理模块起着至关重要的作用,它们往往是系统的薄弱点。因此,容错系统要有高的可靠性必须保证故障检测和处理模块的可靠性,故障检测系统不仅要检测系统模块的故障,而且还要能够检测自身的故障,使故障处理模块得以正确处理所发生的故障。
自校验技术是用于故障快速检测的一种有效手段,特别是具有完全自校验性质的自校验装置,它不仅能及时检出系统模块的差错,还能检测出自身的差错。在容错系统设计中,将自校验网络置于系统中,可大大提高系统对差错的反应能力,使差错潜伏期缩短,有效地防止错误传播。
1 自校验网络定义
一个容错系统,其所有可能的输出值组成的集合U(称输出空间)由S和U-S两部分组成。当系统中无故障时,系统输出S中的元素,一旦系统发生故障则输出U-S中的元素。
如果一个电路的正常输出集S是一个检错码集,则该电路称为自校验电路。在无故障发生的情况下,自校验电路输出码向量;当预定故障发生时,则输出非码向量。连接在自校验电路输出端的校验器监督电路的输出,当非码向量出现时,校验器给出差错指示。自校验电路与校验器一起构成了自校验网络,其结构如图2所示。
下面我们给出自校验网络的几个概念,设S(X)是输入向量空间,是合法输入向量空间,是非法输入向量空间,S(F)是输出向量空间,是合法输出向量空间,是非法输出向量空间,是组合逻辑网络所考虑的单故障集,网络的所有输入取自其合法输入集。
定义1:组合逻辑网络对是自测试的(简称ST),若:对任意故障存在,使网络输出。
该定义是说对给定单故障集中的任何一个故障,总存在一个合法输入,它将导致组合逻辑网络产生非法输出,即用该输入可检测此故障。
定义2:组合逻辑网络对是故障保险的(简称FSE),若:对任意故障存在使网络输出,或者,其中G(X)是网络的正确输出。
该定义是说在合法输入条件下,对给定单故障集中的任何一个故障,组合逻辑网络将给出一个合法输出或一个非法输出,但不会给出同该合法输入不相对应的另一个合法输出。
定义3:组合逻辑网络对是完全自校验的,若它对是自测试的和故障保险的。
对给定单故障集中的任何一个故障,完全自校验的组合逻辑网络在合法输入的情况下,或者产生一个合法输出,或者产生一个非法输出,且后者在故障存在期间是必然要出现的。这就使得网络在不产生不正确合法输出的同时,能并发检测中的所有故障,这也正是在线测试对差错检测及时性的要求。
若采用检错编码技术实现自校验逻辑网络时,校验器的任务是用来检查功能模块输出码字的有效性,它能区分功能模块输出是否合法,这种特性被称为码分离特性,其定义如下。
定义4:一个逻辑网络具有码分离特性,若满足:
(1)任给 ,有(合法输入映射为合法输出)
(2)任给,有(非法输入映射为非法输出)
定义5:一个逻辑网络是完全自校验器,若它具有完全自校验及码分离特性。
设组合逻辑网络正确输入矢量为,则矢量空间称作错误输入空间,记作;空间被称作非法及错误输入空间,记作。由正确输入空间经电路G可在S(F)中产生一个子空间,这个子空间称为正确输出空间,记为。同样,对于合法输入,由组合逻辑网络可映射为合法输出空间它也是输出矢量空间S(F)的子集。同样,空间被称作错误输出空间,记作;空间被称为非法及错误输出空间,表示为。上述输出之间有如下关系:
由上面集合之间的关系我们可以看出,对于无故障组合网络的正确输入,其输出应落入正确输出空间中。通过对网络的输出可部分判定系统工作是否正常(无法判断某些故障)。当网络发生故障时,可分成以下几种情况:①非法及错误输入被映射成;②输入被映射成为;③映入但已不是正确的映射关系,也就是说输入输出关系发生了变化。对于一个高可靠容错系统来说,必须能够以比较高的故障覆盖率来检测出以上三类差错(最好在一拍内检出),使系统及时采取措施,隔离故障,将其影响减小到最低限度。在三类错误中,第①类和第②类与第③类相比要好检测一些,高效检测第③类错误是提高系统故障覆盖率的关键,只有设计出对以上三类错误检出率均较高的检错系统,才能保证系统有较高的可靠性。
2 自校验网络的结构
自校验网络具有在无任何外加激励的情况下能自动检测其内部是否存在故障,这些故障或是永久性的或是暂时性的。设计自校验网络的主要技术有检错编码技术,基于自对偶函数的交替逻辑技术(交织逻辑技术),基于对偶函数的互补逻辑技术,还有基于多值逻辑的实现方法,下面我们主要讨论一些实用的实现方法。
2.1 双轨码校验器
双轨码校验器的原理图如图3所示。
输入矢量为,其中,(i=1,2),输出矢量为且满足:
若且校验器无故障。
利用双轨码校验器的上述特点,设计一对偶组合逻辑网络,使其输出向量和恰好反相,将和加到双轨码校验器输入端,根据就可以判定系统是否发生故障。
2.2 可分码校验器
可分码校验器的结构如图4所示。校验器的输入矢量为),矢量和分别对应可分码的信息分量和校验分量。其中,信息分量宽度为是校验分量的宽度,且1+K=n, n=‖Y‖。校验位生成电路根据信息位重新生成校验位W,由双轨码校验器比较W与的一致性,在无故障的情况下,校验器的输出指示输入矢量的有效性。下面的定理给出了图4完全自校验可分码校验器的构造条件。
定理:图4所示的可分码校验器是完全自校验的,若校验位生成器是一个无冗余的组合逻辑网络,且比较器是完全自校验的。
2.3 互补逻辑网络
利用互补逻辑也可以构成自校验电路,如果某一逻辑网络其输入输出关系为,则可构造一互补逻辑网络,使其输入输出关系为其中f和f是互补的,在无故障的情况下,其输出是互补的;若发生输出相同,则两个逻辑电路中必定有存在故障的情况。互补逻辑网络实现原理比较直观,但对较复杂的系统,有许多故障它是检测不出来的。
2.4 交织逻辑网络
交织逻辑网络是基于自对偶函数的自校验逻辑网络。一个二进制变量是交替的,记作若x在两个连续的时间间隔内所取的值互补。
对任意一个开关函数,若假设是交替二进制变量,且它们是同步交替的,则g的输入矢量可表示为,其输出可表示为,要使输出变量也是交替的,必须满足,显然,g必须是自对偶函数。利用交织逻辑网络的这个特点,可以检测出系统的一部分故障。
3 自校验网络实现方法
对于一些比较简单的应用场合,利用数字逻辑方法进行设计,使用SSI及MSI集成电路即可方便地构成自校验网络。但实际容错系统非常复杂,涉及大量逻辑设计,若仍采用传统的数字逻辑设计方法,不仅工作量大、容易出差错,而且修改和功能仿真都不方便。使用电子设计硬件描述语言VHDL(或Verilog HDL对电路功能进行描述,用FPGA或CPLD器件实现自校验网络是比较现实的,对于大批量生产,可将VHDL描述的电路送半导体器件厂进行批量生产, VHDL硬件描述语言实现自校验网络的步骤如下:
①建立自校验网络的功能模型。对系统的输入/输出、状态转换、信号传递等进行详细的说明。
②用VHDL语言或Verilog HDL语言对电路功能进行描述。对复杂系统可采用撟陨隙聰的设计方法,将系统分解成不同层次的、功能较简单的模块,利用VHDL语言对系统功能进行分层描述,减少系统描述造成的错误。
③对不同层次的模块进行功能仿真,以检验各模块设计的正确性,最后对整个系统进行功能仿真,及早排除系统设计中的错误。
④用VHDL或Verilog HDL综合编译器对设计好的系统进行编译,经过逻辑化简及综合布线,生成可对FPG A或CPLD编程的数据文件。
⑤将数据文件通过编程器写入FPGA或CPLD,进行实际测试,若测试数据满足设计要求,则开发工作完成;否则,转①重新进行检查和设计。
采用自校验技术后,可有效地提高容错系统的可靠性,随着集成电路技术的飞速发展,可将一些自校验功能模块进行封装,作为标准单元使用,在模块级上提高容错系统的可靠性。采用高级语言和FPGA或CPLD开发容错系统具有重要的现实意义,可有效缩短开发周期,降低开发成本,提高系统可靠性,应在工程设计中加以推广应用。
(全文结束)