【APM】WMI问题简单排查办法

【APM】WMI问题简单排查办法

可能遇到的问题:
问题 1.APM 中测试凭证失败
问题 2.APM 中 WMI 凭证测试通过,但会出现告警 WMI 不能获得 XXX 属性数据(偶发或一直存在)。
问题 3.APM 中遇到取数问题。
对于问题 1,首先检查是否满足前提条件:
1.APM 必须安装在 Windows 服务器上
2.需要开放访问的端口:静态端口135、445;动态端口范围:1025-5000、49152-65535
3.需要开启的Windows服务:WMI、RPC、DCOM
4.需要使用具有管理员权限的账户,使用非管理员账号监控的配置办法可参考:
如上述均满足,尝试使用 administrator 账号测试凭证是否通过。
如 administrator 账号可以通过,那就是监控账号问题。
如 administrator 账号依旧不能通过,那可能是上述前提条件有不满足的,或是服务器、WMI协议本身问题。
对于问题 2、3,可以使用以下排查办法(也可以为问题 1进一步佐证
1.登录 APM web UI->设置->自助工具->WMI 工具
选择主机->选择监视器类型为 Windows->选择监控项(可点击 Click Here添加)->设置超时时间->点击执行。

2.执行后,可查看具体执行过程,并且可以查看选择的监控项取值情况。
可用于确认问题 1 是否可以正常连接,以及问题 2、3 取值问题

3.在最底部,有 WMI 整体执行完成所使用时间,可验证问题 2 是否是超时导致
建议多执行几次,看最大花费时间以及平均花费时间是多少,在满足最大执行时间的基础上,以平均执行时间+至少 30s,设置为此监视器的超时时间

上述工具实际上与通过Windows工具wbemtest测试类似,使用Windows工具wbemtest测试可参考:
使用WBEMTEST测试WMI连接:
WMI连接常见问题处理:


    • Related Articles

    • 【APM】服务器内存利用率计算规则(SNMP)

      通过 SNMP 协议对 Windows\Linux 服务器获取并计算物理内存利用率的方式不同。 一.Windows服务器: (1)抓取 hrStorageType OID (.1.3.6.1.2.1.25.2.3.1.2) 的实例。 它将列出目标服务器中可用的不同类型的存储,从列表中我们单独使用 hrStorageRam 的值来计算我们使用的物理内存。 (2)内存总使用量计算: 通过 hrStorageUsed OID (.1.3.6.1.2.1.25.2.3.1.6) 及 ...
    • 【OPM】服务器内存利用率取值、计算规则

      对于服务器内存利用率取值和计算方式: 一.通过 SNMP 计算内存利用率(Windows\Linux 通用) 通过 SNMP 计算内存利用率有两种方式(自动优先使用方式 1): 方式 1.如果 hrStorageType OID (.1.3.6.1.2.1.25.2.3.1.2)返回一个包含 hrStorageRam 的值: (1)注意 hrStorageType OID (.1.3.6.1.2.1.25.2.3.1.2) 的实例,其中包含 hrStorageRam 作为值。 ...
    • WMI凭证未通过,错误为“RPC服务器不可用”

      通过OpManager中的WMI模式添加Windows Server时解决“RPC服务器不可用错误”的步骤。 1) 尝试使用域名\用户名和仅使用用户名添加服务器。 2) 检查是否能够从OpManager服务器ping远程Windows计算机。尝试同时使用主机名和IP地址ping通。 3) 检查OpManager服务器和远程Windows计算机之间是否有防火墙。如果有防火墙,则必须打开防火墙中的端口进行监视。端口是135(RPC)和445(WMI)。之后尝试将其添加到OpManager中。 ...
    • 【OPM】WMI凭证不通,使用WBEMTEST连接被监视服务器提示报错。

      问题描述: 在OPM中测试WMI凭证不通。使用WBEMTEST连接被监视服务器提示报错,报错截图如下。 排查步骤 1. 再次检查输入的登录名和密码是否正确 。 2. 检查是否远程DCOM是否开启,若未开启,请按照下图启用该服务。 具体截图如下 3. 远程主机的用户帐号无效。您可以 打开命令行窗口执行下面的命令,检查用户帐号是否有效: net use \\<RemoteComputerName>\C$ /u:<DomainName\UserName> "<password>" net use ...
    • 【APM】通过 SNMP 监控的服务器、虚拟机发出重启告警的原因

      问题描述: 监控服务器发出重启告警,实际上服务器并未重启。 监控使用 SNMP 凭证。 问题原因: 因受到 SNMP 协议 sysUptime 本身位数(32 位)和返回值最小颗粒度(1/100s)限制,当系统运行时间 2^32/(24*60*60*100)≈497 超过 497 天后,超过最大位数,该值会重新开始累计,与服务器重启表象一致,故会产生服务器重启告警。 只有通过 SNMP 监控的设备才会有此问题,通过 WMI/CLI 方式监控不会有此问题。 ...