事故管理
被考次数: 1次
被考频率: 低频率
答错率:    23%
知识难度:
考试要求: 掌握     
知识路径:  > 信息系统运维的组织与管理  > 信息系统运维的管理  > 信息系统运维管理主要流程  > 信息系统运维管理主要流程


本知识点历年真题试卷分布
>> 试题列表    
 

 
       事故管理包括对引起服务中断或可能导致服务中断、质量下降的事件的管理,这包括了用户提交或由监控工具提交的事故。事故管理不包括与中断无关的正常运营指标或服务请求信息。事故管理的主要目标是尽快恢复正常的服务运营,并将对业务的影响降到最低,从而尽可能保证服务质量和可用性要求。
       事故管理的流程包括事故识别和记录、事故分类和优先级处理、初步支持、事故升级、调查和诊断、解决和恢复、事故关闭等。事故管理基本流程模型如下图所示。
       
       事故管理基本流程模型
       (1)事故识别和记录。通过对所有组件的监控,及时准确地检测出故障或潜在故障,尽可能在未对客户造成影响之前启动事故管理流程。事故记录包含事故基本描述、事故状态、事故类型、事故影响度、事故优先级等信息。
       (2)事故分类和优先级处理。事故的分类通常采用多层次结构,一个类别包括多个子类。分类时将事故归入某一类别或某一子类中。分类时可以按事故发生的可能原因分类,也可按相关支持小组进行分类。当同时处理若干事故时,必须设定优先级。优先级通常用数字来表示,通常根据紧急度和影响度确定。其中,紧急度指在解决故障时,对用户或业务来说可接受的耽搁时间;影响度是指其所影响的用户或业务数量和大小而言,事件偏离正常服务级别的程度。
       (3)初步支持。初步支持是指服务台在与用户协商并达成解决时限后,依据自己职责和能力优先尝试解决事故。如果用户满意解决结果,则服务台关闭事故;如果无法解决事故或用户不满意,则应执行事故升级,转交给二线或三线支持处理。在初步支持过程中,可借助知识库提供帮助。
       (4)事故升级。事故升级是指当前支持人员在规定的时间内不能解决或没有解决某个事故时,便转交给更有经验或更权威的其他人员处理,包括职能性升级和结构性升级两类。职能性升级又称水平升级,是指当前技术人员无法在规定时间内解决事故时,需要具有更多时间、专业技能或访问权限的技术人员参与解决事故;结构性升级又称垂直升级,是指当机构的级别不足以保证事故能及时、满意地得到解决时,需要更多的高级别机构参与进来。
       (5)调查和诊断。事故在提交给指定的支持小组后,支持人员应该对事故进行调查和诊断工作。具体活动包括确定事故发生的位置及用户需要的帮助;确认事故导致的所有影响,包括影响到的用户数量和规模;识别出由此事故触发的其他事件;通过搜索当前事故/问题记录、已知错误数据库、厂商/供应商错误日志或知识库等,整合相关知识。
       (6)解决和恢复。通过对事故的调查和诊断,支持人员制定相关解决方案,并在对该方案进行必要的测试之后提交实施。根据事故性质的不同,实施的行为也有所不同,通常包括指导用户在他们的桌面或远程设备上实施解决方案;服务台实施解决方案,或是远程使用软件控制用户桌面实施解决方案;专业的支持小组实施恢复方案;供应商或厂商解决方案。
 

更多复习资料
请登录电脑版软考在线 www.rkpass.cn

京B2-20210865 | 京ICP备2020040059号-5
京公网安备 11010502032051号 | 营业执照
 Copyright ©2000-2025 All Rights Reserved
软考在线版权所有