|
|
|
调查问题的过程与调查故障的过程类似,但两者的主要目标明显不同:前者是发现故障产生的潜在原因,而后者是尽可能快速地恢复服务。因此,前者比后者调查得更细致深入,需要调查人员掌握更多的经验和技巧,有时还需要专家的支持:同时,问题调查的范围也比故障调查的要广,它包括对故障处理中使用的应急措施的调查等。当发现更好的和新的应急措施时,问题管理还要将其在问题记录中更新以便故障控制使用。
|
|
|
|
问题调查和分析过程需要详细的数据,而很多时候这些数据只有在故障发生时才能被收集到,这是一个矛盾。为了解决这个矛盾,问题调查人员应该与故障控制和计算机网络控制部门协调好有关情况。
|
|
|
|
问题分析方法主要有4种:Kepner&Tregoe法、鱼骨图法、头脑风暴法和流程图法。这里我们重点介绍Kepner&Tregoe法和鱼骨图法。
|
|
|
|
(1) Kepner&Tregoe法。Kepner&Tregoe是一种分析问题的方法,即出发点是解决问题是一个系统的过程,应该最大程度上利用已有的知识和经验。它把问题分析分为以下5个阶段。
|
|
|
|
①定义问题。调查是根据定义问题进行的,因此问题定义必须明确指出IT服务偏离服务级别协议的情况。在这里我们要避免这样一种情况,即认为产生问题的最可能的原因已经明朗,因而不用经过进一步调查而可直接做出结论。这可能导致一开始就选错调查的方向。
|
|
|
|
|
|
|
|
|
|
|
|
.规模和范围。问题的规模和范围多大?哪些部分将受到影响?
|
|
|
|
③找出产生问题的可能原因。根据第二步的比较和实施的变更,尽量发现问题产生的可能原因。
|
|
|
|
④测试最可能的原因。评价每个可能原因以确认其是否就是形成问题症状的原因。
|
|
|
|
⑤验证问题原因。通过上一步的测试后,剩余的可能原因需经进一步测试以确认其是否是产生某个问题的真正原因。一般应优先消除那些可以简单快速验证的起因。
|
|
|
|
(2)鱼骨图法。鱼骨图法是分析问题原因常用的方法之一。在问题分析中,“结果”是指故障或者问题现象,“因素”是指导致问题现象的原因。鱼骨图就是将系统或服务的故障或者问题作为“结果”、以导致系统发生失效的诸因素作为“原因”绘出图形,进而通过图形分析从错综复杂、多种多样的因素中找出导致问题出现的主要原因的一种图形。因此,鱼骨图又叫因果图法。日本质量管理专家石川馨最早使用了这种方法,故有时特性因素图又被称为石川图。
|
|
|
|
|
|
①按具体需要选择因果图中的“结果”,放在因果图的最“右边”(相当于“鱼头”)。
|
|
|
|
|
|
③通过调查分析,判别影响“结果”的所有原因。先画出“大原因”,用直线与主干线相连,并在直线的尾端常用长方形框(或圆圈)框(或圈)起来,在框(或圈)内填入“大原因”的内容;进而依次细分所属的全部原因,直至能采取解决问题的措施为止。各大、小原因之间用不同的直线表示因果之间的关系。
|
|
|
|
④主要的或关键的原因常用框框起来,以表示醒目。根据实际需要,对这些关键的或主要的原因还可以做单独的特性因素图,以便进一步重点深入分析。
|
|
|
|
|
|
|
|
|
|
(3)头脑风暴法。头脑风暴法是一种激发个人创造性思维的方法,它常用于解决问题的方法的前三步:明确问题、原因分类和获得解决问题的创新性方案。针对问题,我们可以应用头脑风暴法来提出所有可能的原因。
|
|
|
|
应用头脑风暴法必须遵守下列4个原则:畅所欲言、强调数量、不做评论、相互结合。
|
|
|
|
(4)流程图法。流程图法通过梳理系统服务的流程和业务运营的流程,画出相应的流程图,关注各个服务和业务环节交接可能出现异常的地方,分析问题的原因所在。流程图中应该包括系统服务中涉及到的软硬件设备、文件、技术和管理人员等所有问题的相关因素。
|
|
|
|
以上每种问题分析方法有其优点和缺点,问题管理人员应选择合适的方法来分析问题。
|
|
|