【APM】通过 SNMP 监控的服务器、虚拟机发出重启告警的原因

【APM】通过 SNMP 监控的服务器、虚拟机发出重启告警的原因

问题描述:
监控服务器发出重启告警,实际上服务器并未重启。
监控使用 SNMP 凭证。

问题原因:
因受到 SNMP 协议 sysUptime 本身位数(32 位)和返回值最小颗粒度(1/100s)限制,当系统运行时间
2^32/(24*60*60*100)≈497
超过 497 天后,超过最大位数,该值会重新开始累计,与服务器重启表象一致,故会产生服务器重启告警。
只有通过 SNMP 监控的设备才会有此问题,通过 WMI/CLI 方式监控不会有此问题。
此监视项原理为通过本次轮询获取的值与上一次轮询获取的值做比较,小于之前的值就会告警。

解决办法:
管理->性能轮询->服务器->勾选 Linux 与 Windows->下划到“服务器错误告警设置”栏->取消“在轮询间隔中服务器被重启则告警”项的勾选->下划并保存:



注意:
1.取消此项勾选后,正常的服务器重启一样不会产生告警信息。
2.不会影响可用性监控。
3.如企业版,需要在每个探针上都做相同的操作。
    • Related Articles

    • 【APM】服务器内存利用率计算规则(SNMP)

      通过 SNMP 协议对 Windows\Linux 服务器获取并计算物理内存利用率的方式不同。 一.Windows服务器: (1)抓取 hrStorageType OID (.1.3.6.1.2.1.25.2.3.1.2) 的实例。 它将列出目标服务器中可用的不同类型的存储,从列表中我们单独使用 hrStorageRam 的值来计算我们使用的物理内存。 (2)内存总使用量计算: 通过 hrStorageUsed OID (.1.3.6.1.2.1.25.2.3.1.6) 及 ...
    • ELA-支持Linux服务器磁盘空间占满的告警通知吗?

      ELA支持Linux服务器磁盘空间近满的告警,可在告警中找到该告警条件进行设置:
    • 【OPM】服务器内存利用率取值、计算规则

      对于服务器内存利用率取值和计算方式: 一.通过 SNMP 计算内存利用率(Windows\Linux 通用) 通过 SNMP 计算内存利用率有两种方式(自动优先使用方式 1): 方式 1.如果 hrStorageType OID (.1.3.6.1.2.1.25.2.3.1.2)返回一个包含 hrStorageRam 的值: (1)注意 hrStorageType OID (.1.3.6.1.2.1.25.2.3.1.2) 的实例,其中包含 hrStorageRam 作为值。 ...
    • WMI凭证未通过,错误为“RPC服务器不可用”

      通过OpManager中的WMI模式添加Windows Server时解决“RPC服务器不可用错误”的步骤。 1) 尝试使用域名\用户名和仅使用用户名添加服务器。 2) 检查是否能够从OpManager服务器ping远程Windows计算机。尝试同时使用主机名和IP地址ping通。 3) 检查OpManager服务器和远程Windows计算机之间是否有防火墙。如果有防火墙,则必须打开防火墙中的端口进行监视。端口是135(RPC)和445(WMI)。之后尝试将其添加到OpManager中。 ...
    • 邮件服务器故障排除

      以下是在邮件服务器设置过程中面临的一些常见问题,这些问题超出了OpManager的控制范围。 1.连接问题 超时问题 未提供需要的身份验证 未配置必需的TLS 可以配置TLS,但不是必选项 支持 TLS 1.2 2. 权限问题 中继访问被拒绝 服务器IP地址未包括在中继例外列表中 单击 此处(链接稍后添加) 查看与上述情况相关的常见异常及其疑难解答 如果无法解决问题,请按照以下步骤运行测试程序,以检查MailServer和OpManager已安装服务器之间的链接。 3. 连接可能不一致的网络问题 ...