|
知识路径: > 计算机系统知识 > 系统配置和方法 > 系统可靠性 > 可靠性指标与设计,可靠性计算与评估 >
|
相关知识点:23个
|
|
|
|
|
计算机系统的硬件故障通常是由元器件的失效引起的。对元器件进行寿命试验并根据实际资料统计得知,元器件的可靠性可分为三个阶段。首先,器件工作处于不稳定期,失效率较高;第二阶段,器件进入正常工作期,失效率最低,基本保持常数;第三阶段,元器件开始老化,失效率又重新提高;这就是所谓的“浴盆模型”。因此,应保证在计算机中使用的元器件处于第二阶段。在第一阶段,对元器件应进行老化筛选,而到了第三个阶段则应淘汰计算机。
|
|
|
计算机系统的可靠性用平均无故障时间(MTTF)来度量,即计算机系统平均能够正常运行多长时间,才发生一次故障。系统的可靠性越高,平均无故障时间越长。可维护性用平均维修时间(MTTR)来度量,即系统发生故障后维修和重新恢复正常运行平均花费的时间。系统的可维护性越好,平均维修时间越短。
|
|
|
计算机系统的可用性定义为:MTTF/ (MTTF+MTTR)×100%。由此可见,计算机系统的可用性定义为系统保持正常运行时间的百分比。这里涵盖了衡量计算机系统的三个重要指标,即可靠性、可维护性、可用性。可用性高不仅意味着设备和系统故障频率低,还意味着故障后的不可用时间很短,能给用户提供更多正常使用的时间。人们常常对可靠性与可用性之间的差异产生误解,两者的定义似乎非常相似。但是两者有一个重要的差别,那就是系统是可维修的还是不可维修的。可靠性通常低于可用性,因为可靠性要求系统在[0,t]的整个时间段内必须正常运行;而对于可用性,要求就没有那么高,系统可以发生故障,然后在时间段[0,t]内修复。
|
|
|
|
计算机系统是一个复杂系统,而且影响其可靠性的因素相当之多,很难直接对其进行可靠性分析。但通过建立适当的数学模型,把大系统分割成若干子系统,可以简化其分析过程。常见的系统可靠性数学模型有以下三种。
|
|
|
|
串联系统是组成系统的所有单元中任一单元失效就会导致整个系统失效的系统。下图为串联系统的可靠性框图。假定各单元是统计独立的,则其可靠性数学模型为:
|
|
|
|
|
|
式中,Ra——系统可靠度;Ri——第i单元可靠度。
|
|
|
|
并联系统是组成系统的所有单元都失效时才失效的系统。下图为并联轴系统的可靠性框图。假定各单元是统计独立的,则其可靠性数学模型为
|
|
|
|
|
|
|
|
|
|
|
混联系统的两个典型情况为串并联系统如下图一所示和并串联系统如下图二所示。
|
|
|
|
|
|
|
串并联系统的数学模型为,当各单元可靠度都相等,均为Rij=R,且m1=m2…=mn=m,则。
|
|
|
并串联系统的数学模型为,当各单元可靠度都相等,均为Rij=R,且n1=n2=…=nm=n,则Rs=1-(1-Rn)m。
|
|
|
一般串并联系统的可靠度,对单元相同的情况,高于并串联系统的可靠度。
|
|
|
|
(1)提高元器件质量,改进加工工艺与工艺结构,完善电路设计。
|
|
|
(2)发展容错技术,使得在计算机硬件有故障的情况下,计算机仍能继续运行,得出正确的结果。
|
|
|