|
|
|
ITIL提供了一个概念化、模块化的优秀框架,与其说是解决方案,不如说它更像理论。它提出了建立IT服务管理体系时要考虑哪些流程,提到了应该做哪些,好处在哪儿,但并不详细介绍怎样去做,因此它本身不具备实际操作可能性。
|
|
|
|
在长期的运维项目中积累的丰富的经验,根据政府门户网站的实际情况,对ITIL进行适当选取、适应和扩展。
|
|
|
|
(1)导入ITIL是一个长期过程,运维初期,以“系统日常运行和支持”为主,重点解决服务支持(Service Support)流程,对发生的问题进行维护和处理。在运维后期,运维的服务支持流程步入正轨后,再关注运维服务的长期计划和改进,考虑服务提供(Service Delivery)。
|
|
|
|
(2)针对政府门户网站,运维的主要任务是解决发生的问题,对IT基础架构进行基本的配置管理,因此主要实现“服务台”“事件管理”“问题管理”和“配置管理”,至于变更管理在实际运维中,暂时没有系统工具支持。
|
|
|
|
(3)由于初期运维工作内容多,系统繁杂,人员少,为提高运维人员解决问题的能力和效率,运维体系扩展加设“知识库”,以提高运维技术的积累、传承、利用。
|
|
|
|
经过对ITIL体系进行适当选取、适应和扩展,从适合政府门户网站,适合运维团队完成任务目标为主,制定了个性化的运维体系。
|
|
|
|
个性化的政府门户网站运维体系设置“服务台”统一接受各种故障受理,包括最终用户直接电话或邮件传来的求助信息和运维监控软件传过来的自动报警信息,然后对服务台问题分析并归类,力求初步解决用户或系统的故障;不能在线解决的需求问题,启动“事件管理”和“问题管理”流程,运维人员按照既定的流程,在“知识库”和“配置管理”的支持下,解决故障,并把积累的经验知识归入知识库。问题解决后,运维体系反馈到IT系统,促使其更好更稳定运行,并促进其优化和完善。
|
|
|
|
其中,“知识库”和“配置管理”可以依托运维监控工具实现信息化作业,而“服务台”“事件管理”和“问题管理”则仍然依照对应的制度人工操作,暂时没有信息化系统辅助运行,可以考虑在后期建设运维平台时优先实现。
|
|
|
|
所有的事件都应该基于影响度、紧急度和优先级进行分类分级,并提供相应的解决方案和临时方案,如下表所示。
|
|
|
|
|
|
|
|
一级故障是指系统发生严重故障,业务发生中断,或虽然业务未中断但已经无法保证及时、正确的情况,对用户业务的运行有严重影响。
|
|
|
|
二级故障是指对于系统发生的非严重故障,业务并未中断,业务仍然及时、正确的情况,但性能有所下降。
|
|
|
|
三级故障是指系统发生轻微的故障,系统有警告信息等,对系统没有较大影响的故障。
|
|
|