网格控制目标维护: 诊断相关的“代理不可到达”状态问题步骤
适用于:
企业管理器网格控制 - 版本:10.1.0.2到:10.2.0.5 - 发行:10.1至10.2
目的
本文档提供了步骤来诊断代理的目标是“代理不可到达”在其网页中的地位问题.
-在10.1网格控制台,代理网页可以访问管理系统 - >代理 ->点击代理名称。
-在10.2网格控制台,代理网页可以访问设置 - >代理 - >代理名称。
代理网页也可能会显示错误,如:
Oracle管理服务主机代理主机之间的通信不可用。任何功能或显示的信息,要求该通信链路将不可用。例如:删除/配置/添加目标,上传的度量数据,或显示代理主网页的信息,如代理管理服务的响应时间(ms)。
此代理监管的目标也将有一个状态:代理无法到达,而不是目标的实际状态。
其他参考:
Note 1084777.1: 在10g企业管理器网格控制代理重要的通信元件的描述
Note 1097545.1: 重要的Java线程的描述了10g网格控制Oracle管理服务(OMS)
最后修该日期
2010,10.5
读者说明
提供故障排除指南,以协助调试一个具体问题。在可能的情况下,诊断工具都包含在该文件,以协助故障排除。
故障排除详情
背景
每当OMS更新代理配置信息传输到代理关于改变监测的目标之一,它必须主动与代理联系。在最初的代理OMS沟通,其EMD_URL的价值,使OMS的启动通信代理需要代理上传。在随后的通信尝试从OMS的代理,基于代理的EMD_URL,如果连接不能建立,则OMS将标记为“不可达”的代理。
OMS 需要联系代理的一些原因:
管理的目标配置更改:如果一个目标需要一个配置更改(如更改密码),这个修改后的元数据将被提交由管理员通过UI,然后传送到代理的OMS。
添加/删除目标:如果目标已不再是有效的,或者需要添加一个新的目标,这些目标的变化需要被发送到代理
实时统计:如果用户选择实时度量的细节,OMS将联系代理来得到当前的度量数据。例如,在一个Unix / Linux机器的主机性能页的“十大进程的细节。
作业操作: 所有预定的工作和所有工作更新需要传送到代理。
OMS pings: 如果OMS检测代理不再是上传数据和严重性,它会尝试联系在两个阶段的代理::
a) Ping the EMD_URL
b)做到 hostmachine的ICMP ping测试, 看主机是否相应.
停电操作: 所有计划停电和停电更新需要被发送到代理,等等。
有几个原因,管理代理将显示“代理不可达”的地位。
1. 代理未运行.
2. 代理无法解析最初成功跳转后的OMS主机名.
3. 代理运行和上传的文件,但不能上传文件到OMS.
4. 已锁定了OMS从代理接收只有HTTPS连接,但这个特殊的代理配置HTTPS通信.
故障排除步骤:
1. 验证代理状态
登陆到代理机器并执行:
cd <AGENT_HOME>/bin
emctl 状态代理
输出应类似于以下这样的情形:
Oracle Enterprise Manager 10g Release 5 Grid Control 10.2.0.5.0.
Copyright (c) 1996, 2009 Oracle Corporation. All rights reserved.
---------------------------------------------------------------
Agent Version : 10.2.0.5.0
OMS Version : 10.2.0.5.0
Protocol Version : 10.2.0.5.0
Agent Home : /home/em/oracle/gc102/agent10g
Agent binaries : /home/em/oracle/gc102/agent10g
Agent Process ID : 6560
Parent Process ID : 6544
Agent URL : https://agentmachine.domain:3872/emd/main/
Repository URL : https://omsmachine.domain:1159/em/upload
开始于 : 2010-10-01 09:28:21
启动用户 : em
最后刷新: 2010-10-01 14:47:45
上次上传成功: 2010-10-05 11:34:47
总兆字节的XML文件上传到目前为止 : 201.65
待上传文件数 : 0
XML 文件大小 待上传(MB) : 0.00
上传文件系统的可用磁盘空间 : 84.87%
最后陈宫连接到OMS : 2010-10-05 11:36:10
---------------------------------------------------------------
代理正在运行并就绪。
注:
- 在输出的第一行,如果不指明了正确的版本,或不提“网格控制”,那么你正在检查输出控制或DB控制代理组成部分。此代理无法沟通与OMS。
.
- 如果代理没有运行,你需要开始使用:emctl开始代理
2. 验证OMS通信代理
如果代理正在运行,强制执行一个上传:
cd <AGENT_HOME>/bin
emctl upload
输出类似于以下:
Oracle企业管理器10g第5版网格控制10.2.0.5.0。.
版权所有(c)1996年,2009年甲骨文公司。保留所有权利.
---------------------------------------------------------------
EMD upload completed successfully
如果上传失败,请参阅注释550617.1:如何有效地调查和诊断10g网格代理问题上传到Oracle管理服务(OMS)
3. 验证OMS代理通信
通过网格控制的用户界面,检查管理系统 - >代理网页
代理网页将列出约最后成功的沟通与代理及代理的当前状态的细节。如果与代理沟通是可能的,“立即上传”按钮,将启用.
您还可以查看实时统计。强制从OMS连接到代理的最简单的方法是通过实时统计。从“管理系统”选项卡 - >转到代理网页 - >“常规”部分中,选择主机。主机上的主页,选择“性能”选项卡“
如果实时的统计数据,OMS是与代理沟通的能力
.
如果代理正在运行,但网格控制台中的网页显示无法访问代理,验证了OMS代理连接使用1088414.1注的步骤:如何解决Oracle管理服务(OMS)和在10g网格代理组件之间的通信企业管理器网格控制
如果许多或所有代理都显示为不可,这可能是一个潜在的问题的OMS/库数据库年底.
- 下载并安装的的最新EMDiag套件(repvfy工具)注421053.1。
执行:
cd <EMDIAG_HOME>/bin
repvfy verify
repvfy verify -detail
- 检查为EM水平DBMS_JOB报告的任何错误,是在设置>管理的事务及库>库行动网格控制台页面。请参阅
Note 1178258.1: “管理服务和信息库”网格控制台/显示器的监视器(MTM的)页的概述
Note 1164855.1: 10g网格控制管理信息库的概述,,
第3条.MGMT_VIEW用户, 库视图 and DBMS_Jobs
- 检查OMS日志/跟踪文件,验证OMS是否还存在任何问题.
Note 1161003.1:注10g网格控制OMS性能问题
在目标机器上运行的代理的网格控制台显示EMD_URL比较。为了获得作为SYSMAN库数据库使用sqlplus充分EMD_URL,登录,并发出下面的SQL语句:
SELECT emd_url FROM mgmt_targets
WHERE target_name ='<hostname of the Agent machine as seen in the UI>'
AND target_type = 'host';
EMD_URL
-----------------------------------------------------------------------
https://agentmachine.domain:3872/emd/main/
这应该符合“代理URL”,在“emctl代理人在代理端的输出值。例如:
Agent URL : https://agentmachine.domain:3872/emd/main/
这个值被存储在<AGENT_HOME>/ SYSMAN/配置/ emd.properties文件作为EMD_URL参数。.
4. 获取代理的可用性自卸
使用EMDiag套件(repvfy工具),我们可以获取转储目标可用性的详细信息,如存储库数据库。有关详细信息,请参阅注释399899.1:在企业管理器网格控制目标可用性故障排除脚本:网格控制目标维修
代理目标, 执行:
cd <EMDIAG_HOME>/bin
repvfy转储可用性名agentmachine.domain:3872型oracle_emd