|
|
|
|
|
故障现象。服务器无法正常连接,且设备面板指示灯有异常提示(细节参考服务器随机文档)。
|
|
|
|
检查及处理方式。观察服务器指示灯信号,并根据设备随机手册查找故障说明。
|
|
|
|
处理方式——检查设备的网线、电源线、光纤线缆是否松脱。如外接设备无松脱现象,应尽快联系设备售后服务机构现场处理,不得随意拆卸设备部件自行维修。
|
|
|
|
|
|
注:此类故障发生概率一般较小,且通常会被总部先监控到。但当发生网站无法访问的故障时,维护人员应先排除是否由此类故障的可能性之后,再进行下一步排查工作。
|
|
|
|
故障现象。互联网访问链路中断,网站服务器无法被外部访问到。故障现象是内网访问网站正常,但不能通过互联网访问网站。
|
|
|
|
检查及处理方式。检查服务器自身服务是否正常运行在服务器控制台桌面(注意:指通过服务器设备直连的显示器、键盘、鼠标等设备访问服务器)。
|
|
|
|
打开IE或其他Web浏览器,访问XXX88.10,如能正常显示首页,则表示服务器自身服务运行正常,可能是网络故障引起。
|
|
|
|
|
|
|
|
如果返回超时,则表明网络故障可能发生在机房,请联系运行处协助处理。
|
|
|
|
如果返回正常,则表明网络故障可能发生在上一环节,可能是前端的负载均衡设备工作异常或网络链路中断,请同时联系运行处处理。
|
|
|
|
|
|
故障分析。当前网络环境正常,但无法通过内、外网访问网站首页。客户端浏览器显示网站无法访问之类的错误提示。
|
|
|
|
导致该故障的可能原因有:服务未启动或启动了错误的Apache版本。系统自带软件防火墙或安全策略干扰。
|
|
|
|
|
|
分别登录到两台Web服务器(XXX.47/XXX.49)的远程SSH终端或服务器控制台终端,并切换到root账户,输入如下命令:
|
|
|
|
|
|
如果返回结果表明无httpd进程运行,需要重启Apache服务,操作命令为:
|
|
|
|
|
|
如经过以上方式的排查,仍未能解决问题,则可能是Apache配置错误导致网站服务工作不正常,可通过error_log文件进行详细检查。
|
|
|
|
|
|
故障分析。网站能访问,但响应极其缓慢,打开网页时间远超正常范围。
|
|
|
|
导致该故障的可能原因有:服务器磁盘设备故障导致I/O性能低下;服务器网卡故障;网络设备或线路繁忙;服务器忙于处理大规模的并发请求(很可能是DDoS攻击);IHS自身不稳定导致资源耗尽而不能正常工作。
|
|
|
|
检查及处理方式。检查机房网管监控中是否有网络流量异常现象。检查服务器硬盘指示灯是否有故障提示。检查当前的CPU和内容占用情况,观察httpd进程是否占用资源过多,操作命令:
|
|
|
|
|
|
检查服务器当前tcp连接情况,观察对80端口的访问请求是否过多(正常情况一般在1000以下)。
|
|
|
|
|
|
断开网线后,在服务器控制台桌面访问XXX88.10,如果访问速度正常,则表明服务器软、硬件工作正常。
|
|
|
|
|
|
故障分析。网站能访问,但网站中页面与后台发布信息不一致。
|
|
|
|
导致该故障的可能原因有:WCM发布引擎未能正常生成HTML静态页面;文件未能正常同步到Web服务器中;未能正常监控到WCM发布目录中文件变化情况。
|
|
|
|
检查及处理方式。直接访问WCM服务器XXX88.10,检查页面是否更新正常。如果WCM服务器中网页也未能正常更新,可重新在WCM中发布页面,或重新启动WCM服务器。如果WCM服务器中网页更新正常,则登录到XXX.153服务器SSH终端,检查文件iguard服务是否工作正常:
|
|
|
|
|
|
|
|
|
|
如果监控服务已经在运行,则检查Web服务器端iguard服务是否工作正常。
|
|
|
|
通过SSH终端登录到XXX.47/XXX.49中,检查iguard服务是否工作正常。
|
|
|
|
|
|
如以上方式均检查无问题,可在iguard服务器端,运行同步命令强制同步,并观察是否有错误信息输出。同时检查Web iguard服务器端中是否有错误提示。
|
|
|
|
|
|
故障分析。网站能访问,但网站搜索引擎页面出现错误信息且无法正常返回查询结果。
|
|
|
|
导致该故障的可能原因有:搜索引擎中未正常配置搜索相关路径反向代理;搜索引擎服务运行故障。
|
|
|
|
检查及处理方式。检查IHS配置文件是否加入对XXX8.21服务器的反向代理。
|
|
|
|
|
|
|
|
|
|
如已经正确配置,则检查文本搜索引擎是否工作正常,并重启相关服务。
|
|
|
|
|
|
|
|
导致该故障的可能原因有:WCM集群中的应用通过NFS方式共享文件,如果某一节点中未能正常装载(mount)上/opt/XXXWCMV65/WCMData目录,则可能造成用户无法访问上传的文件。
|
|
|
|
检查及处理方式。分别登录到XXX.20和XXX.42服务器中,检查相关目录是否绑定到NAS存储中。
|
|
|
|
如发现未能正常绑定,则重新运行mount命令。mount-tnfsXXX.20:/opt/XXXWCMV65/WCMData//opt/XXXWCMV65/WCMData/。
|
|
|
|
|
|
故障分析。网站能访问,但登录“工作平台”出现系统异常页面。
|
|
|
|
导致该故障的可能原因有:WCM集群中的应用工作不正常。
|
|
|
|
检查及处理方式。登录XXX8.20或XXX8.42集群服务器执行命令ps-ef|grep Tomcat查看Tomcat服务。重新启动Tomcat服务。
|
|
|
|
|
|
|
|
为提高突发事件应急响应水平,应急领导小组应定期组织一次预案演练;检验应急预案各环节之间的通信、协调、指挥等是否符合快速、高效的要求。通过演练,进一步明确应急响应各岗位责任,对预案中存在的问题和不足及时补充和完善。
|
|
|
|
|
|
|
|
|
|
|
|
|
|
应急小组各角色根据模拟事件说明自己的工作,操作步骤,汇报对象;
|
|
|
|
|
|
|
|
|
|
|
|
应急小组负责人宣布应急工作完成,安排值守人员,解散应急小组;
|
|
|
|
|