|
知识路径: > 信息系统开发和运行管理知识 > 系统运行管理知识 > 系统故障管理(处理步骤、监视、恢复过程、预防措施) > 故障及问题管理 > 故障管理流程 > 故障监视 >
|
相关知识点:4个
|
|
|
|
从以上对故障的原因归类来看,人员、规范操作的执行、硬件和软件是故障监视的重点所在。另外,自然灾害因素由于难以预计和控制,需要进行相关风险分析,可采取容灾防范措施来应对。
|
|
|
(1)对系统硬件及设备的监视包括各主机服务器及其主要部件、专门的存储设备、网络交换机、路由器,等等。对硬件设备监控方法主要是采用通用或者专用的管理监控工具,它们通常具有自动监测、跟踪和报警的功能。
|
|
|
(2)对软件的监视主要针对其应用性能、软件bug和变更需求。对软件的性能监控也可以采一些管理监控工具,但由于应用系统主要面向用户,应用系统的缺陷通常由专门的测试工程师负责监视,或者在使用的过程中由用户方发现并提出。变更需求也是在用户使用和监视二合一的过程中发现的。
|
|
|
(3)需要监视的人员包括系统操作员、系统开发工程师、用户、来访者,甚至包括系统所在机房的清洁工和运输公司的职工,等等。要对他们与系统的接触过程中的行为进行跟踪和记录,防止或者及早发现非标准的操作带来的系统故障或者服务故障。
|
|
|