|
知识路径: > 信息系统运维的组织与管理 > 信息系统运维的管理 > 信息系统运维管理主要流程 > 信息系统运维管理主要流程 >
|
相关知识点:13个
|
|
|
|
事件管理负责记录、快速处理信息系统运维管理中的突发事件,并对事件进行分类分级,详细记录事件处理的全过程,便于跟踪了解事件的整个处理过程,并对事件处理结果统计分析。事件是指引起或有可能引起服务中断或服务质量下降的不符合标准操作的活动,不仅包括软硬件故障,而且包括服务请求,如状态查询、重置口令、数据库导出等,因此又叫事故/服务请求管理。
|
|
|
事件管理流程的主要目标是尽快恢复信息系统正常服务并减少对信息系统的不利影响,尽可能保证最好的质量和可用性,同时记录事件并为其他流程提供支持。事件管理流程通常涉及事件的侦测记录、事件的分类和支持、事件的调查和诊断、事件恢复及事件的关闭。事件管理基本流程模型如下图所示。
|
|
|
|
|
(1)事件发生和通告。事件发生后,配置项以轮询和通知两种方式产生通告信息,其中轮询是通过管理工具的询问,配置项被动地提供相关信息;而通知是为特定状态满足后,配置项主动产生通告。
|
|
|
(2)事件检测和录入。事件发生后,管理工具通过两种方法对其进行检测,第一种是通过运行在同一系统之上的代理,检测和解析通告信息,并将其发送给管理工具;第二种是管理工具直接读取和解析通告信息的含义。
|
|
|
(3)事件过滤。当检测到事件后,应当对其进行过滤。过滤的目的是确定哪些事件应被通过,哪些事件可以被忽略。例如,连续产生的一系列相同事件通告,只通过第一个到达的通告,其余则可忽略。对于过滤掉的事件应当及时记录到日志文件中。
|
|
|
(4)事件分类。根据事件的重要性,将事件分为信息类、告警类和异常类。信息类事件通常存入日志文件中;告警类事件需要提交给事件关联做进一步分析,以决定如何处理;异常类事件需判定是否需要提交给事故、问题或变更管理中的一个或多个管理流程来处理。
|
|
|
(5)事件关联。事件关联是指通过特定的管理工具将告警类事件与一组事先规定的标准和规则进行比较,从而识别事件的意义并确定相应的事件处理行动。这些标准和规则通常被称为业务准则,说明了事件对业务的影响度、优先级、类别等信息。
|
|
|
(6)响应选择。根据事件关联的结果,可以选择自动响应,报警和人为干预,事故、问题或变更判定等方式处理告警类事件。如果告警类事件及其处理方法已被充分识别和认识,则可以为其定义合适的自动响应方式。如果告警类事件处理需要人为干预,则应该发出报警信息通知相关人员或团队。如果告警类事件处理需要通过事故、问题或变更管理的一个或多个流程完成,则需要启动相应的流程。当初始事件被判定为异常,或是在事件关联中管理工具将一类或一组告警类事件的发生定义为事故时,则应当启动事故管理;在故障尚未发生时,通过对事件进行完备成熟的评估和分析得出问题存在,则直接启动问题管理;当事件被判定为异常时,组织可能依据自身的事故管理和变更管理的策略确定启动哪个流程。
|
|
|
(7)事件关闭。不同类型的事件有不同的关闭形式。信息类事件通常不存在关闭状态,它们会被录入到日志中并作为其他流程的输入,直到日志记录被删除;自动响应的告警类事件通常会被设备或应用程序所自动触发的另一事件关闭;人为干预的告警类事件通常在合适的人员或团队处理完毕评估后关闭;异常类事件通常在成功启动事故、问题或变更管理流程后评估关闭。
|
|
|
(8)事件评估。因为事件发生频率非常高,不可能对每件事件都进行正式的评估活动。如果事件触发了事故、问题或变更管理,评估重点应当关注事件是否被正确移交,并且是否得到了所期待的处理;对于其他事件,则进行抽样评估。
|
|
|