1.概述
在下午3点15分,收到亿阳监控系统发来的tuxapp@45的qitfq_2,队列中请求数为26,当登录到主机时,查看该队列时,队列中的请求数稳定在8-9左右。下面进行进一步查看。
2.问题分析
使用tmadmin管理工具,查看该队列的请求执行情况。
可以看到有Server执行完请求,处于IDLE状态,等待下一个请求,长时间观察该队列情况发现,发下有部分Server处于长时间执行状态,下面数据为半小时后的状态,
对比上面数据,发现ID为7003、7002、7001、7005、7006、7009的itfq2server处于长时间执行状态,所有的请求均由剩下的server处理。
再次进行对比数据
发现7002已经成功返回结果,执行新的请求。
从以上查看,Server并非陷入死循环,而是执行时间很长。
3.建议
根据以上情况,请联系亚联工作人员确认itfq2server是否会执行较长时间。
1、若该Server的并不会执行较长时间,建议优化代码,并在ubb配置文件的SERVICES字段的添加ITF_Q2SVC服务并添加SVCTIMEOUT超时参数,该参数主要是维护Server端系统安全的角度,防止由于系统异常引起的失控服务占据系统资源,阻碍正常的后续业务请求。它起到了一个清道夫的作用,将不能有效提供服务的Services清除出系统,并依靠系统的其他机制,重新产生具有活力的Services。
超时后果:超时后,此Service所属的Server将被系统的SIGKILL信号清除;此操作不会影响与此Server相关的其他正在运行的副本Servers。
如果系统设置SERVERS->RESTART=Y,那么,被清除的Server将立刻自动重新启动。重新启动的次数受随后介绍的MAXGEN和GRACE两个参数联合限制。
该建议以提过很多次,只有提供ITF_Q2SVC服务的Server会受到该参数的影响,不会影响其他的Server。
2、若该Server可能长时间执行同一请求,建议在交易较小时,重启该Server,避免出现队列堵塞,即所有Server均处于长时间均行状态,使后来的请求排队,出现业务超时。
3、鉴于所有的Tuxedo系统均配置了自适应特性,在系统中配置了大量的自适应特性时,导致频繁的访问BBL,出现自适应增长失败情况,因此在ubb配置文件中新建一该Server,即将itfq2server配置信息复制一份,只修改SRVID、RQADDR参数即可,重新编译并启动系统。
该贴被funny编辑于2014-2-18 0:09:51