1、监控TUXEDO服务
可不可以监控每一次会话的时间?
aix server
sco unix client
在stderr里面可以看到每个service的执行时间。
还可以用txrpt性能分析工具分析你的service的性能,一般说来,每个交易的service除了查询不要操作2、3秒,最好是只有不到1秒的响应时间。
tuxedo的service标准是写到stderr.
但是也可以在ubbconfig配置文件里定义。
谢谢各位,能不能说的详细一点。
我现在是有很多应用上来,我想看到每一个应用使用的时间,通过一段时间的统计,来知道那些应用占用时间比较多。
txrpt usage:
txprt [-d mm/dd] [-s time] [-e time] < stderr | pg
txprt [-d mm/dd] [-s time] [-e time] < stderr | grep 某个service
例如:txrpt -d 01/01 -s 14 -e 16 < stderr | pg
txrpt -d 03/30 -s 14 -e 16 < stderr | grep SS_CQJZ
要想看到每一个应用最好是对每一个server,都分开记一个日志。
现在我们的server 是分开记日志的,在每个日至中可以看到会话时间马?
stderr在什么目录下?
在配置的ubbconfig中的server增加-r参数,然后使用txrpt命令查询每个server的运行时间。
stderr在UBBCONFIG文件的$APPDIR目录下。
例如:
ubbconfig中SERVERS部分举例:
*SERVERS
DEFAULT:
CLOPT="-A -r"
-----------------------
$txrpt -s 8:00 -e 16:00 <stderr
输出信息如下:
START AFTER: Tue Mar 30 10:00:00 2004
END BEFORE: Tue Mar 30 15:00:00 2004
SERVICE SUMMARY REPORT
SVCNAME 10a-11a 11a-12n 12n-1p 13p-14p 14p-15p S
Num/Avg Num/Avg Num/Avg Num/Avg Num/Avg g
--------------- -------- -------- -------- -------- -------- -
RPTSRV 5676/0.02 3456/0.02 3060/0.02 4314/0.02 4428/0.02 2
QUEACCONT 4297/0.02 2683/0.02 2331/0.02 3357/0.02 3463/0.02 2
UPDATESRV 1459/0.22 955/0.14 801/0.07 1200/0.15 1249/0.12 5
那我看到的是每一个server的访问次数和平均时间,我想问的是每一次交易的时间是否能统计!谢谢
每一次交易的时间就是在stderr文件的每一行中有详细的说明,默认是在tuxedo的server的相同目录下,也可以改变,在ubbconfig配置文件中的server选项中定义。
比如:看到的结果
SERVICE PID SDATE STIME EDATE ETIME
服务名 开始日期 开始时间 结束日期 结束时间
-------- ---------- --------- ------ --------- ------
@AS_TYCJ 25284 946863808 209117 946863808 209127
@AS_TYCJ 24104 946863809 209258 946863809 209264
@AS_TYCJ 25026 946863814 209697 946863814 209742
@PS_XCGSWJ 25284 946864107 239080 946864108 239094
通过观察发现,TUXEDO服务积压严重,表现在GWTDOMAIN服务,可以断定大部分业务压力来自前台营业系统通过DOMAIN访问我们的TUXEDO服务。
对UBBCONFIG文件做了以下调整:
1、MAXWSCLIENTS由845调整为2000(这个值最好大于LICENSE数量);
2、增大服务数量:
s2001MARKINFO SRVGRP=USER_SDCRM SRVID=18001 MIN=8 MAX=15
CLOPT="-A -r -o /crm/inter/run/log/s2001MARKINFO.log"
s2001MARKINFO2 SRVGRP=USER_SDCRM SRVID=19101 MIN=8 MAX=15
CLOPT="-A -r -o /crm/inter/run/log/s2001MARKINFO2.log"
s2014CUSTINFO SRVGRP=USER_SDCRM SRVID=18701 RESTART=Y MIN=20 MAX=20
CLOPT="-A -r -o /crm/inter/run/log/s2014CUSTINFO.log"
JSL SRVGRP=JSLGRP_SDCRM SRVID=8000 RESTART=Y GRACE=0 MAXGEN=10
CLOPT= "-A -r -- -n //130.17.0.231:7800 -d /dev/tcp -m10 -M50 -x10"
WSL SRVGRP=WSLGRP_SDCRM SRVID=8100 RESTART=Y MAXGEN=10
CLOPT= "-A -r -- -n //130.17.0.231:7700 -d /dev/tcp -m15 -M50 -x10 -K both -c 10240"
3、所有服务增加-o参数:CLOPT="-A -r -o
存在主要的问题:
1、服务配置数量不合理:访问量很大的服务s2014CUSTINFO、2001MARKINFO、s2001MARKINFO2进程原来配置只启动了2个,导致业务积压;其他服务访问量都非常小,建议观察服务执行次数,调整所有服务合理的进程数量;
2、JSH/WSH启动数量不够;
3、JSL的端口和GWTDOMAIN端口相差太近(7800,7811),如果JSH配置较多(超过10个),将会导致GWTDOAMIN启动不了,建议修改二者中的一个;
4、访问量较大的服务s2001MARKINFO为短连接,建议修改;
5、怀疑通过WEBLOGIC访问JOLT的客户端没有关闭连接,导致连接不停的增长,比如tmadmin中pclt看到的部分内容:
SDCRM User.497@7800 webuser 0:10:26 IDLE/W 0/0/0
SDCRM User.498@7800 webuser 0:10:25 IDLE/W 0/0/0
如果此问题不解决,TUXEDO LICENSE不够和WEBLOGIC无法登陆的问题将仍然存在;
日常维护建议:
1、观察中间件队列情况:利用脚本231:/crm/inter/run/bin/psr.sh;
2、查看服务执行效率报告:txrpt -d 07/07 -s 8:00 -e 16:00 <stderr|grep s2001MARKINFO报告文件名;建议stderr文件每日凌晨清空,否则将会很大;
txrpt -d 07/07 -s 14 -e 16 < stderr
txrpt -d 07/07 -s 8:00 -e 16:00 <stderr|grep s2001MARKINFO
我观察中发现,s2014CUSTINFO的调用量相当大,并发量每秒能达到20~30笔(下午4点左右),快赶上吉林移动1860的并发量了,此系统已经是一个实时性要求高,并发量大的OLTP系统了。