通过观察发现,TUXEDO服务积压严重,表现在GWTDOMAIN服务,可以断定大部分业务压力来自前台营业系统通过DOMAIN访问我们的TUXEDO服务。
对UBBCONFIG文件做了以下调整:
1、MAXWSCLIENTS由845调整为2000(这个值最好大于LICENSE数量);
2、增大服务数量:
s2001MARKINFO SRVGRP=USER_SDCRM SRVID=18001 MIN=8 MAX=15
CLOPT="-A -r -o /crm/inter/run/log/s2001MARKINFO.log"
s2001MARKINFO2 SRVGRP=USER_SDCRM SRVID=19101 MIN=8 MAX=15
CLOPT="-A -r -o /crm/inter/run/log/s2001MARKINFO2.log"
s2014CUSTINFO SRVGRP=USER_SDCRM SRVID=18701 RESTART=Y MIN=20 MAX=20
CLOPT="-A -r -o /crm/inter/run/log/s2014CUSTINFO.log"
JSL SRVGRP=JSLGRP_SDCRM SRVID=8000 RESTART=Y GRACE=0 MAXGEN=10
CLOPT= "-A -r -- -n //130.17.0.231:7800 -d /dev/tcp -m10 -M50 -x10"
WSL SRVGRP=WSLGRP_SDCRM SRVID=8100 RESTART=Y MAXGEN=10
CLOPT= "-A -r -- -n //130.17.0.231:7700 -d /dev/tcp -m15 -M50 -x10 -K both -c 10240"
3、所有服务增加-o参数:CLOPT="-A -r -o
存在主要的问题:
1、服务配置数量不合理:访问量很大的服务s2014CUSTINFO、2001MARKINFO、s2001MARKINFO2进程原来配置只启动了2个,导致业务积压;其他服务访问量都非常小,建议观察服务执行次数,调整所有服务合理的进程数量;
2、JSH/WSH启动数量不够;
3、JSL的端口和GWTDOMAIN端口相差太近(7800,7811),如果JSH配置较多(超过10个),将会导致GWTDOAMIN启动不了,建议修改二者中的一个;
4、访问量较大的服务s2001MARKINFO为短连接,建议修改;
5、怀疑通过WEBLOGIC访问JOLT的客户端没有关闭连接,导致连接不停的增长,比如tmadmin中pclt看到的部分内容:
SDCRM User.497@7800 webuser 0:10:26 IDLE/W 0/0/0
SDCRM User.498@7800 webuser 0:10:25 IDLE/W 0/0/0
如果此问题不解决,TUXEDO LICENSE不够和WEBLOGIC无法登陆的问题将仍然存在;
日常维护建议:
1、观察中间件队列情况:利用脚本231:/crm/inter/run/bin/psr.sh;
2、查看服务执行效率报告:txrpt -d 07/21 -s 8:00 -e 16:00 <stderr grep s2001MARKINFO报告文件名;建议stderr文件每日凌晨清空,否则将会很大;
txrpt -d 07/21 -s 14 -e 16 < stderr
txrpt -d 07/21 -s 8:00 -e 16:00 <stderr|grep s2001MARKINFO
我观察中发现,s2014CUSTINFO的调用量相当大,并发量每秒能达到20~30笔(下午4点左右),快赶上吉林移动1860的并发量了,此系统已经是一个实时性要求高,并发量大的OLTP系统了
该贴被liujia编辑于2012-3-21 13:09:32该贴被liujia编辑于2012-3-21 13:16:14该贴被liujia编辑于2012-3-22 13:56:19