|
知识路径: > 信息系统运维的组织与管理 > 信息系统运维的组织 > 系统运行的故障管理 > 系统运行的故障管理 >
|
相关知识点:19个
|
|
|
|
现代的基于计算机的信息系统在运行过程中不可避免都会有因发生故障而失效的时候。硬件故障、软件错误、人工操作失误甚至对系统的恶意破坏,这些故障都可能导致信息系统运行的非正常中断,影响系统中数据的正确性,或者破坏系统的数据库,使部分甚至全部数据丢失。
|
|
|
通过信息系统的可靠性指标可以衡量和预测系统故障的发生。信息系统的可靠性是指,在满足一定条件的应用环境中系统能够正常工作的能力。由于信息系统在逻辑上是由各个子系统和功能模块构成,因此,可以按照一般工程系统的可靠性研究方法进行单元可靠性和系统可靠性的评价,也可以通过系统平均无故障运行时间、系统开工率和系统平均维修时间等指标来定量衡量。
|
|
|
信息系统的可靠性实际上还包含了对数据安全性的要求,因为不完整的业务数据,必然会导致用户在具体业务应用上的障碍,所以组织必须在保障业务数据安全性的前提下,再来考虑信息系统的可靠性。运用后文所述的策略和手段,可以保证发生故障时业务数据的完整性,并且在一定程度上可以保证系统在较短时间内的迅速恢复正常运行。尽管如此,对某些要求业务系统的不间断运行组织而言,即使是极短时间的运行中断也是无法接受的,这时就需要具有极高的系统可靠性。
|
|
|
在实施故障恢复时可能会非常困难,仅仅简单地找出问题并在中断处恢复执行常常是不可能的,系统需要大量附加的冗余数据和处理操作。因此信息系统所采用的恢复技术对系统的可靠性起着决定性的作用,对系统的运行效率也有很大影响,它是衡量信息系统性能优劣的一项重要指标。
|
|
|