[转帖]Domain Communication Problems (Frequent Disconnectio)_MQ, Tuxedo及OLTP讨论区_Weblogic技术|Tuxedo技术|中间件技术|Oracle论坛|JAVA论坛|Linux/Unix技术|hadoop论坛_联动北方技术论坛  
网站首页 | 关于我们 | 服务中心 | 经验交流 | 公司荣誉 | 成功案例 | 合作伙伴 | 联系我们 |
联动北方-国内领先的云技术服务提供商
»  游客             当前位置:  论坛首页 »  自由讨论区 »  MQ, Tuxedo及OLTP讨论区 »
总帖数
1
每页帖数
101/1页1
返回列表
0
发起投票  发起投票 发新帖子
查看: 3783 | 回复: 0   主题: [转帖]Domain Communication Problems (Frequent Disconnectio)        下一篇 
wlcbhrss
注册用户
等级:新兵
经验:68
发帖:65
精华:0
注册:2011-8-21
状态:离线
发送短消息息给wlcbhrss 加好友    发送短消息息给wlcbhrss 发消息
发表于: IP:您无权察看 2014-11-3 15:50:12 | [全部帖] [楼主帖] 楼主

Hi,

We are using Oracle tuxedo, Version 10.3.0.0, 64-bit, Patch Level 095 on AIX 6.1 power 7 machine. We have four domain (2 domain have MP configuration(master-slave) and 2 individual domains). There are local and remote service published in domains. During test runs we found that doamins keep on disconnecting from each other and not connected again altough we get re-connection message in ULOG.

Let me present one scenarion. I got following from ULOG.

071515.uaix3034!GWTDOMAIN.18022630.772.0: LIBGWT_CAT:1130: INFO: Disconnected from domain (domainid=<PATDom2>)

071515.uaix3034!GWTDOMAIN.18022630.772.0: LIBGWT_CAT:1354: INFO: Retrying domain (domainid=<PATDom2>) every 60 seconds

071515.uaix3034!GWTDOMAIN.18022630.772.0: LIBGWT_CAT:1502: WARN: Message with TPNOREPLY to service ..TMS dropped - network down

071515.uaix3034!GWTDOMAIN.18022630.772.0: LIBGWT_CAT:1502: WARN: Message with TPNOREPLY to service ..TMS dropped - network down

071515.uaix3034!GWTDOMAIN.18022630.772.0: LIBGWT_CAT:1502: WARN: Message with TPNOREPLY to service ..TMS dropped - network down

071552.uaix3034!GWTDOMAIN.18022630.772.0: LIBGWT_CAT:1502: WARN: Message with TPNOREPLY to service ..TMS dropped - network down

071552.uaix3034!GWTDOMAIN.18022630.772.0: LIBGWT_CAT:1502: WARN: Message with TPNOREPLY to service ..TMS dropped - network down

071552.uaix3034!GWTDOMAIN.18022630.772.0: LIBGWT_CAT:1502: WARN: Message with TPNOREPLY to service ..TMS dropped - network down

071553.uaix3034!GWTDOMAIN.18022630.772.0: LIBGWT_CAT:1129: INFO: Connection established with domain (domainid=<PATDom2>)

071602.uaix3034!GWTDOMAIN.18022630.772.0: LIBGWT_CAT:1130: INFO: Disconnected from domain (domainid=<PATDom1>)

071602.uaix3034!GWTDOMAIN.18022630.772.0: LIBGWT_CAT:1354: INFO: Retrying domain (domainid=<PATDom1>) every 60 seconds

071602.uaix3034!GWTDOMAIN.18022630.772.0: LIBGWT_CAT:1502: WARN: Message with TPNOREPLY to service ..TMS dropped - network down

071602.uaix3034!GWTDOMAIN.18022630.772.0: LIBGWT_CAT:1502: WARN: Message with TPNOREPLY to service ..TMS dropped - network down

071602.uaix3034!GWTDOMAIN.18022630.772.0: LIBGWT_CAT:1502: WARN: Message with TPNOREPLY to service ..TMS dropped - network down

071602.uaix3034!GWTDOMAIN.18022630.772.0: LIBGWT_CAT:1502: WARN: Message with TPNOREPLY to service ..TMS dropped - network down

071602.uaix3034!GWTDOMAIN.18022630.772.0: LIBGWT_CAT:1502: WARN: Message with TPNOREPLY to service ..TMS dropped - network down

071602.uaix3034!GWTDOMAIN.18022630.772.0: LIBGWT_CAT:1502: WARN: Message with TPNOREPLY to service ..TMS dropped - network down

071652.uaix3034!GWTDOMAIN.18022630.772.0: LIBGWT_CAT:1502: WARN: Message with TPNOREPLY to service ..TMS dropped - network down

071652.uaix3034!GWTDOMAIN.18022630.772.0: LIBGWT_CAT:1502: WARN: Message with TPNOREPLY to service ..TMS dropped - network down

071652.uaix3034!GWTDOMAIN.18022630.772.0: LIBGWT_CAT:1502: WARN: Message with TPNOREPLY to service ..TMS dropped - network down

071652.uaix3034!GWTDOMAIN.18022630.772.0: LIBGWT_CAT:1502: WARN: Message with TPNOREPLY to service ..TMS dropped - network down

071652.uaix3034!GWTDOMAIN.18022630.772.0: LIBGWT_CAT:1502: WARN: Message with TPNOREPLY to service ..TMS dropped - network down

071652.uaix3034!GWTDOMAIN.18022630.772.0: LIBGWT_CAT:1502: WARN: Message with TPNOREPLY to service ..TMS dropped - network down

071653.uaix3034!GWTDOMAIN.18022630.772.0: LIBGWT_CAT:1129: INFO: Connection established with domain (domainid=<PATDom1>)

I get a message that connection is reestablished (last line of log above) but one of the remote service called from remote domain PATDom1 failed with TPESTSTEM Error and it was through only after many retries and after bbclean and pclean was run through tmadmin.

This is a true OLTP application and outgoing message are not sent in real time and delayed due to service failures.

I have following questions:

1/ Does LIBGWT_CAT:1502 point to network between domain being down where as actually this is not the case as it is checked at network level and there is no issue or it points to some other error ?

2/ How to trace domain communication(service calls across domain) more effectively so that any service failure can be detected early and handled.

Regards,

Ajeet Tewari

--转自 北京联动北方科技有限公司




赞(0)    操作        顶端 
总帖数
1
每页帖数
101/1页1
返回列表
发新帖子
请输入验证码: 点击刷新验证码
您需要登录后才可以回帖 登录 | 注册
技术讨论