我尝试计算probe_success的数量,并将其乘以探测间隔,试图获得以秒为单位的正常运行时间,并将值类型设置为总数。问题是随着时间范围的变化,最小步骤发生变化,无法给我们正确的读数并使该选项无效。我们实际上想做的是根据仪表板设置的时间范围内的成功探测来获取正常运行时间百分比。我们使用 singlestat 来显示百分比
(probe_success{instance="www.google.com:443",job="clienttest"})*15
我们尝试将价值除以出口商本身,试图得到一个同样会缩放的百分比,但无济于事。
sum(probe_success{instance="www.google.com:443",job="clienttest"}) / sum(probe_success{instance="self",job="clienttest"}) *100
对于 singlestat 面板,您要做的就是使用probe_success{instance="www.google.com:443",job="clienttest"}
作为表达式,并在选项下确保您使用的是平均聚合。
在 PromQL 方面你也可以这样做avg_over_time(probe_success[1h])
, see 这篇博文 https://www.robustperception.io/what-percentage-of-time-is-my-service-down-for/.
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)