【OPM】通过工作流进一步检测设备可用性参考

【OPM】通过工作流进一步检测设备可用性参考

Idea
目的:设备可用性出现“问题”级别告警时,通过工作流 ping 4 个包验证设备是否确实 ping 不通,并对不同结果添加相应告警注释,设备可以 ping 通时自动清除本次告警。
Info
配置步骤:
1.OPM web GUI->工作流->新建工作流:
Info
2.拖动左侧设备-> ping 设备到指定箭头位置:
Info
3.弹窗中可以调整的设置为:
请求数、数据包大小、超时时间、重试次数。
如无特殊需求,按照默认设置配置为 4、32、1、0 即可。
Info
4.左侧OpManager 下,拖动添加告警注释到 Ping 设备结果为否的位置。
Ping 设备结果为否代表 ping 4 个包均请求超时。
Info
5.在弹窗中,自定义编辑名称和注释内容。
例如名称更改为:确认设备Down
添加注释的内容编辑为:自动ping $DeviceField(ipAddress) 确认设备Down,请管理员立即检查!
Info
6.再次拖动添加一个告警注释到 ping 设备,是处:
是代表设备可以 ping 通。
编辑告警注释名称为:验证设备Up
告警注释为:自动ping $DeviceField(ipAddress) 确认设备Up,自动清除本次告警
Info
7.拖动 OpManager 下清除告警到验证设备Up下的箭头位置,并确认。
Info
8.点击下一步,在设备选择中,将想要触发此工作流的设备添加到右侧清单中,可以过滤不同的业务视图、设备类型以便选择,设置完成后点击下一步:
Info
9.配置触发器->选择告警触发器->勾选常规触发器下,当设备错过“要关注的”重要度,并到最下方点击下一步。
这里的条件选择说明有些问题,实际意义为:当设备出现“问题”(黄色叹号)可用性告警时。
Info
10.给这个工作流自定义一个名称。
并选择是否添加描述、让这个工作流工作的时间、是否延迟执行、是否循环执行。
最后保存。
Idea
实际应用效果:
当出现设备“问题”级别可用性告警时,会立即触发 ping 对应设备 4 个包,若依然全部请求超时,则添加告警备注:
Idea
若设备可以 ping 通,则添加告警注释,并自动恢复此次告警:
Idea
在工作流日志中,会记录每次触发此工作流执行的过程和结果:

    • Related Articles

    • OpManager中的设备可用性

      OpManager中的设备可用性基于来自OpManager服务器各个设备的ICMP Ping响应。可用性,数据包丢失和响应时间都将基于此响应进行计算。 基本标准是,可以从OpManager服务器访问设备从而进行发现,否则设备可能会处于“未监视”状态。 启用ping实用程序后仍然可以访问设备,并且每当OpManager服务器访问设备时,设备将更新一次。  它适用于所有服务器,网络设备,防火墙,UPS和打印机以及已添加到应用程序中的任何设备类型和系列。
    • 【OPM】快速配置批量配置设备可用性监视间隔

      通过 OpManager 的设置->快速配置->监视间隔,可快速根据设备分类,配置设备的轮询间隔(可用性): 配置不同分类设备的轮询间隔,并且可以配置是否启用设备可用性轮询,配置完成后保存即可:
    • 【OPM】可用性监控说明

      OpManager 中默认使用 ICMP 来监控设备可用性。 也就是到轮询时间时,去 ping x.x.x.x,根据回包来判断设备up/down。 同时,我们也支持通过 SNMP 或 TCP 方式来监控可用性。 我们推荐使用 ICMP 方式监控可用性。 可用性选择 ICMP,并不会影响通过 SNMP 或 WMI\CLI 等其他协议监控性能指标。 在产品中,监控可用性可从设备概况界面->监视方式来查看使用哪种协议监控设备可用性 可以通过编辑设备,来选择使用哪种协议监控可用性:
    • 【OPM】设备ICMP(ping)可用性告警原因分析

      在 OpManager 中,当发生通过 ICMP(ping)监控设备可用性的告警时,实际情况分以下两大类: 1.设备关机/宕机/网络连接故障等。 2.网络阻塞/波动或服务器/产品进程阻塞等其他原因造成的短暂丢包/连接超时 OPM 在轮询时遇上上述两种情况都会发出可用性告警,对于情况 2 出现时,设备管理员在看到告警时检查设备状态和网络连接时,由于是短暂时间内发生的问题,故会发现设备和网络正常,OPM 也会在下一次轮询时发现设备可达并恢复设备状态为正常。 ...
    • 我没有看到Tomcat监视器的“线程可用性”图表。

      “线程可用性”的数据将仅显示Tomcat服务器的5.x版本。此数据不适用于Tomcat服务器的3.x和4.x版本。