第一章 摘要
此文档详细记录了XXX局人资系统在2013年11月1日15:00左右发生的应用访问异常问题,以及整个问题的分析处理全过程。
第二章 故障分析
2.1 故障系统
系统名称 人资系统
IP地址 ...
域名 Base_domain
集群server AdminServer(admin)
监听地址、端口 ...:7001
Jvm配置 -Xms4096m -Xmx8192m
2.2 故障表象描述
根据客户描述,XXX系统是在2013年11月3日下午12点分左右应用系统登陆出现异常,用正确的用户名密码登陆后,无法正常进入系统页面,一直停留在登陆页面。
2.3 故障处理过程
时间点
过程描述
2013年11月3日
11:00左右
客户访问人资系统时,系统登陆异常。
12:05左右
接到客户反映,前往潮州解决故障。
14:10左右
到达现场,经查看,发现故障是由于数据库主机故障引起的,并联系主机方面的同事,协调处理故障。
17:10左右
主机故障解除。
17:15左右
经客户查看系统恢复正常。
2.4 故障影响
此故障涉及系统为人资系统,系统使用较少,并且当天是周日,没有人使用,故障影响较小。
2.5 分析过程
通过产看weblogic控制台,发现可用连接为零,并且测试数据库连接失败。判断数据库可能存在问题。
登陆数据库主机,发现数据库主机已经宕机。
发现故障原因。
第三章 故障原因
故障主要由于数据库主机宕机引起的。
第四章 解决方案
重启数据库主机及数据库。
第五章 总结
系统登陆异常,通常是由于由于相关资源耗尽引起的,以硬件资(内存,cpu)源耗尽的的情况较为常见,在本例中,该异常主要是由数据库主机宕机,导致数据库连接不可用引起的。
在中间的使用过程中,如果相关硬件出现异常,很容易导致中间件的异常,建议加强对硬件设备的监控。
该贴被funny编辑于2014-3-3 14:40:20