【APM】WMI问题简单排查办法
【APM】WMI问题简单排查办法
可能遇到的问题:
问题 1.APM 中
测试凭证失败
。
问题 2.APM 中 WMI 凭证测试通过,但会出现告警
WMI 不能获得 XXX 属性数据
(偶发或一直存在)。
问题 3.APM 中遇到
取数
问题。
对于
问题 1
,首先检查是否满足
前提条件:
1.APM 必须安装在 Windows 服务器上
2.需要开放访问的端口:
静态端口
135、445;
动态端口范围:
1025-5000、49152-65535
3.需要开启的Windows服务:
WMI、RPC、DCOM
4.需要使用具有管理员权限的账户,使用非管理员账号监控的配置办法可参考:
https://support.manageengine.cn/portal/zh/kb/articles/%E9%85%8D%E7%BD%AE%E9%9D%9E%E7%AE%A1%E7%90%86%E5%91%98%E7%94%A8%E6%88%B7%E4%BB%A5%E8%BF%9B%E8%A1%8Cwmi%E7%9B%91%E8%A7%86
https://support.manageengine.cn/portal/zh/kb/articles/%E9%85%8D%E7%BD%AEwmi%E7%9B%91%E8%A7%86%E7%9A%84%E9%9D%9E%E7%AE%A1%E7%90%86%E5%91%98-admin-%E7%94%A8%E6%88%B7
如上述均满足,尝试使用 administrator 账号测试凭证是否通过。
如 administrator 账号可以通过,那就是监控账号问题。
如 administrator 账号依旧不能通过,那可能是上述前提条件有不满足的,或是服务器、WMI协议本身问题。
对于
问题 2、3
,可以使用以下排查办法(也可以为
问题 1进一步佐证
)
1.登录 APM web UI->设置->自助工具->WMI 工具
选择主机->选择监视器类型为 Windows->选择监控项(可点击 Click Here添加)->设置超时时间->点击执行。
2.执行后,可查看具体执行过程,并且可以查看选择的监控项取值情况。
可用于确认
问题 1 是否可以正常连接,以及问题 2、3 取值问题
。
3.在最底部,有 WMI 整体执行完成所使用时间,
可验证问题 2 是否是超时导致
建议多执行几次,看最大花费时间以及平均花费时间是多少,在满足最大执行时间的基础上,以
平均执行时间+至少 30s,设置为此监视器的超时时间
。
上述工具实际上与通过Windows工具wbemtest测试类似,使用
Windows工具wbemtest测试可参考:
使用WBEMTEST测试WMI连接:
https://support.manageengine.cn/portal/zh/kb/articles/%E4%BD%BF%E7%94%A8wbemtest%E6%B5%8B%E8%AF%95wmi%E8%BF%9E%E6%8E%A5
WMI连接常见问题处理:
https://support.manageengine.cn/portal/zh/kb/articles/wmi
Related Articles
【APM】服务器内存利用率计算规则(SNMP)
通过 SNMP 协议对 Windows\Linux 服务器获取并计算物理内存利用率的方式不同。 一.Windows服务器: (1)抓取 hrStorageType OID (.1.3.6.1.2.1.25.2.3.1.2) 的实例。 它将列出目标服务器中可用的不同类型的存储,从列表中我们单独使用 hrStorageRam 的值来计算我们使用的物理内存。 (2)内存总使用量计算: 通过 hrStorageUsed OID (.1.3.6.1.2.1.25.2.3.1.6) 及 ...
【OPM】服务器内存利用率取值、计算规则
对于服务器内存利用率取值和计算方式: 一.通过 SNMP 计算内存利用率(Windows\Linux 通用) 通过 SNMP 计算内存利用率有两种方式(自动优先使用方式 1): 方式 1.如果 hrStorageType OID (.1.3.6.1.2.1.25.2.3.1.2)返回一个包含 hrStorageRam 的值: (1)注意 hrStorageType OID (.1.3.6.1.2.1.25.2.3.1.2) 的实例,其中包含 hrStorageRam 作为值。 ...
WMI凭证未通过,错误为“RPC服务器不可用”
通过OpManager中的WMI模式添加Windows Server时解决“RPC服务器不可用错误”的步骤。 1) 尝试使用域名\用户名和仅使用用户名添加服务器。 2) 检查是否能够从OpManager服务器ping远程Windows计算机。尝试同时使用主机名和IP地址ping通。 3) 检查OpManager服务器和远程Windows计算机之间是否有防火墙。如果有防火墙,则必须打开防火墙中的端口进行监视。端口是135(RPC)和445(WMI)。之后尝试将其添加到OpManager中。 ...
【APM】通过 SNMP 监控的服务器、虚拟机发出重启告警的原因
问题描述: 监控服务器发出重启告警,实际上服务器并未重启。 监控使用 SNMP 凭证。 问题原因: 因受到 SNMP 协议 sysUptime 本身位数(32 位)和返回值最小颗粒度(1/100s)限制,当系统运行时间 2^32/(24*60*60*100)≈497 超过 497 天后,超过最大位数,该值会重新开始累计,与服务器重启表象一致,故会产生服务器重启告警。 只有通过 SNMP 监控的设备才会有此问题,通过 WMI/CLI 方式监控不会有此问题。 ...
【APM】Linux磁盘 I/O rate 监控
在 Applications Manager 中,对 Linux 操作系统的磁盘 I/O rate 仅可监控具体分区,目前没有总磁盘I/O rate 监控。 磁盘 I/O 相关监控项: 参考链接: https://www.manageengine.com/products/applications_manager/help/linux-performance-monitoring.html#disk