我试图根据 Prometheus 黑盒导出器的成功响应来计算 Grafana 的正常运行时间

2024-05-16

我尝试计算probe_success的数量,并将其乘以探测间隔,试图获得以秒为单位的正常运行时间,并将值类型设置为总数。问题是随着时间范围的变化,最小步骤发生变化,无法给我们正确的读数并使该选项无效。我们实际上想做的是根据仪表板设置的时间范围内的成功探测来获取正常运行时间百分比。我们使用 singlestat 来显示百分比

(probe_success{instance="www.google.com:443",job="clienttest"})*15

我们尝试将价值除以出口商本身,试图得到一个同样会缩放的百分比,但无济于事。

sum(probe_success{instance="www.google.com:443",job="clienttest"}) / sum(probe_success{instance="self",job="clienttest"}) *100

对于 singlestat 面板,您要做的就是使用probe_success{instance="www.google.com:443",job="clienttest"}作为表达式,并在选项下确保您使用的是平均聚合。

在 PromQL 方面你也可以这样做avg_over_time(probe_success[1h]), see 这篇博文 https://www.robustperception.io/what-percentage-of-time-is-my-service-down-for/.

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

我试图根据 Prometheus 黑盒导出器的成功响应来计算 Grafana 的正常运行时间 的相关文章

  • Grafana 多值浮点 histogram_quantile

    嗨 我正在强制解决 histogram quantile 问题 如果我将变量设置为多值 这样我就可以重复面板 然后我收到错误消息 字符 21 处解析错误 意外字符 我的要求是 histogram quantile percentile av
  • 如何更改 Grafana 中的背景颜色?

    我想修改 Grafana 中的深色主题 以便它使用 000000作为背景颜色 我见过 如何更改Grafana的默认黑色 https stackoverflow com questions 41006070 how to change def
  • Prometheus 按标签子字符串分组

    我正在尝试解决在 Prometheus 中按指标进行查询求和和分组的问题 其中分配给指标值的标签对于我的求和和分组要求是唯一的 我有 ElasticSearch 索引的度量采样大小 其中索引名称标记在度量上 索引的命名如下 并放置在标签 i
  • 如何使用 Grafana 和 Wamp 的 LDAP 身份验证进行单点登录?

    我正在尝试使用 LDAP 为 grafana 添加单点登录 我遇到过LDAP 的 Grafana 文档 http docs grafana org installation ldap 但我不明白 我可以使用 LDAP 获得单点登录功能吗 如
  • 普罗米修斯时间序列在没有更新的情况下持续多长时间

    如果我向 Prometheus 发送一个仪表 则有效负载具有时间戳和如下值 指标名称 标签 值 2 0 16239938546837 如果我在普罗米修斯上查询它 我可以看到一条连续的线 如果不发送相同指标的有效负载 线路就会停止 几分钟后发
  • 无法在 Spring Boot 2(版本 2.0.0.M7)中包含 Prometheus 指标

    无法在 Spring Boot 2 版本 2 0 0 M7 项目中包含 Prometheus 指标 根据千分尺文档 https micrometer io docs ref spring 2 0 prometheus added sprin
  • Kubernetes Prometheus CrashLoopBackOff / OOMKilled 谜题

    我定期看到容器状态 已终止 OOMKilled 退出代码 137 但调度到内存充足的节点 k get statefulset n metrics NAME READY AGE prometheus 0 1 232d k get po n m
  • 如何使用 Prometheus 警报规则检测新指标

    假设我有一个指标request failures对于用户 对于每个用户 我向指标添加一个唯一的标签值 所以对于用户来说u1 当请求失败两次时 我得到以下指标 request failures user name u1 2 我还有一条规则 当
  • Prometheus:如何根据 Consul 标签删除目标

    我的 Prometheus 服务器从 Consul 获取其目标列表 或 服务 用 Consul 的行话来说 我只想监视这些目标的子集 这应该可以通过普罗米修斯的正则表达式机制实现 但我无法正确配置 这是怎么做到的 我已经搜索过网络 但没有一
  • 禁用对特定主机的警报,同时对所有其他主机发出警报

    我有数百台主机向普罗米修斯服务器报告 我的每个主机有很多出口商 我希望能够列出我不希望收到警报的主机列表 我仍然需要对这些主机进行普罗米修斯监控 我尝试过匹配没有接收器的路线 这不起作用 我究竟做错了什么 或者说 我应该怎么做 我的路线规则
  • 将矩阵与 SUM 相乘

    我想将一个指标与另一个指标之和的结果相乘 我想尝试做的事情 MeticOne SUM MetricTwo Thanks 假设你有MetricOne带标签id and name 你有MetricTwo还有标签id and name 然后你就得
  • 如何重置grafana的admin密码(由helm安装)

    我的密码曾经有效 但我不记得是否更改过 但是 我无法重置它 我尝试过但没有成功 kubectl get secret namespace default grafana o jsonpath data admin password base
  • Prometheus - 在 static_configs 中添加目标特定标签

    我的工作定义如下 job name test name static configs targets 192 168 1 1 9100 192 168 1 1 9101 192 168 1 1 9102 labels group devel
  • 显示从午夜到现在的计数器数据

    我的应用程序包含一些计数器 它总是增加并且从不重置 我将 prometheus 与 grafana 一起使用 我需要的是显示与每天相关的计数器变化 换句话说 我需要获取从午夜到现在的计数器数据 例如 我可以查看月份图表并检查计数器每天如何变
  • prometheus中每个节点的CPU使用率

    理想情况下 我必须找出每个节点上 Pod 的 CPU 使用率百分比 但我试图找出每个节点的CPU使用率 我已经编写了查询 但它给了我超过 100 可以是 150 200 即使包含多个 cpu 的情况 我取了平均值 您能帮我理解下面的查询有什
  • 如何在Prometheus中查询容器内存限制

    我正在使用 Prometheus 工具来监控我的 Kubernetes 集群 我在部署中设置了资源限制 内存限制 并且需要配置一个面板来显示可用的总内存 请让我知道在 Prometheus 中运行以获得可用于我的部署的总内存限制所需的查询
  • 使用 Prometheus 获取总磁盘空间和可用磁盘空间

    我尝试获取 Kubernetes VM 上的总磁盘空间和可用磁盘空间 以便可以显示其已占用空间的百分比 我尝试了名称中包含 文件系统 的各种指标 但没有一个显示正确的总磁盘大小 应该使用哪一个来做到这一点 这是我尝试过的指标列表 node
  • Prometheus 中同一目标上运行的多个抓取作业

    我正在研究需要以不同的抓取间隔抓取指标的用例 例如 metric one每1小时需要刮擦一次metric two每15s刮擦一次 这两个指标都来自同一目标 我尝试过的解决方案如下 global scrape interval 15s scr
  • 丢失系列/数据的警报

    我试图了解当指标不再被抓取时如何让 Grafana 提醒我 我在这个例子中使用的指标是mongodb instance uptime seconds 当实例出现故障时 不再生成指标 导致 Prometheus 中指标丢失 此时警报已触发wh
  • 如何使用 kubeadm 升级来更改 kubeadm-config 中的某些功能

    我想在现有的 kubernetes 集群 v1 10 上安装 kube prometheus 在此之前 文档说我需要将控制器 调度器的IP地址从127 0 0 1 to 0 0 0 0 并且还推荐使用kubeadm 配置升级 https k

随机推荐

  • 有没有办法在 JTS 中将自相交多边形转换为多重多边形?

    取无效多边形POLYGON 0 100 100 100 0 0 100 0 0 100 一个带有未声明交点的煮蛋定时器形状 许多说明说 JTS 可以使用以下命令创建此版本的有效版本 buffer method Geometry input
  • 使用 utf-8 的 Java BufferedWriter 对象

    我有以下代码 我想让输出流使用 utf 8 基本上我有这样的角色 显示为 233 所以看起来像是编码问题 我见过很多使用 的例子 OutputStreamWriter out new OutputStreamWriter new FileO
  • TFS 构建控制器:“无法加载文件或程序集“Microsoft.WindowsAzure.StorageClient,版本=1.7.0.0”

    如您所知 您的 TFS 预览版不支持 Azure SDK 1 8 因此我们使用本地 TFS 构建控制器来构建我们的项目 在 Azure 持续集成部署构建期间 我们收到此错误 Exception Message Could not load
  • 只允许一种身份验证机制;只有 X-Amz-Algorithm 查询参数..?

    我正在尝试将 PUT 请求发送到 amazonS3 预签名 URL 即使我只有一个 PUT 请求 我的请求似乎也被调用了两次 第一个请求返回200 OK 第二个返回400 Bad Request 这是我的代码 var req method
  • MS Access - 粘贴确认事件后

    当用户将记录直接粘贴到数据表子报表中时 是否可以在显示粘贴确认消息后捕获事件 我需要它能够在审计表中创建新记录时进行记录 通过捕获更新前 更新后和插入事件 我可以轻松创建已添加的记录集合 准备将详细信息插入审核日志 但是在所有这些事件触发后
  • 对 Pandas DataFrame 进行类型检查

    我想对 Pandas DataFrames 进行类型检查 即我想指定 DataFrame 必须具有哪些列标签以及哪种数据类型 dtype 存储在其中 一个粗略的实现 受此启发question https stackoverflow com
  • 第一次点击时的 event.preventDefault() 然后删除

    如果它有一个类子导航 我会禁用默认锚点 如下所示这把小提琴 http jsfiddle net aaronk85 5Quee 我只希望在第一次单击时禁用此功能 然后我希望恢复正常的锚点功能 做这个的最好方式是什么 我尝试了涉及以下代码的操作
  • 在 docker 中将 pgadmin 连接到 postgres

    我有一个docker compose与服务文件python nginx postgres and pgadmin services postgres image postgres 9 6 env file env volumes postg
  • 使用 Promise 对 Google 表格进行多次查询

    我是一名初学者编码器 需要一些帮助来加快我的 Google 表格查询速度 我环顾四周 找不到解决方案 我正在尝试快速对 Google 表格运行 25 个查询 这就是我的尝试方式 对 Google 工作表运行查询 将结果推送到数组 运行不同的
  • LinqToSql 声明和实例化 DataContext 最佳实践?

    设置 DataContext 以便在扩展 LinqToSql 类中轻松访问方面的最佳实践是什么 例如 我的 dbml 中有一个 User 实体 我想向该类添加方法 如下所示 Partial Public Class User Public
  • 从队列更新活动的最佳方法

    我有一个LinkedBlockingQueue在我的 生产者 调解者 消费者 模型中的调解者中 Producer 首先更新将 Mediator 添加到 ActivityQueue 中 接下来 消费者 活动在队列中等待 侦听并获取下一个项目
  • 尝试渲染 SDL_Texture 时 C++ SDL2 错误:无效纹理

    我正在尝试制作一个简单的游戏 当我尝试渲染我的SDL Texture 我收到一个莫名其妙的错误 我已经将一切设置正确 我能够成功地清除屏幕SDL RenderClear 并且我的纹理不为空 因此它应该已正确创建 但是当我尝试打电话给rend
  • 检测桌面是否被锁定[重复]

    这个问题在这里已经有答案了 可能的重复 如何以编程方式确定我的工作站是否被锁定 https stackoverflow com questions 44980 how can i programmatically determine if
  • 错误请求 400:nginx/gunicorn

    我已经遵循了这个教程 http blog wercker com 2013 11 25 django 16 part3 html http blog wercker com 2013 11 25 django 16 part3 html我现
  • 删除缺失的数据值

    我删除了原始帖子 以便能够发布更大版本的数据集 实际上总共有 418 行 这是我正在进行的生存分析的数据 第一列是 ID 号 其他列标记为 V2 V20 有很多缺失的数据 用 表示 我用coxph 函数来获取以下内容 Saves survi
  • 如何使用 Compose 创建具有用户定义的 IP 和 MAC 地址的 Docker macvlan

    我有一个使用 MAC 地址执行硬件许可证的 Docker 项目 我无法更改此设置 ISV 使用包含 MAC 地址的硬件指纹 我正在尝试创建一个 macvlan 网络 它将使用物理适配器并从我的网络 DHCP 服务器获取 IP 地址 或者我将
  • 使用自动布局、IB 和字体大小时表头视图高度错误

    我正在尝试为我的 uiTableView 创建一个标题视图 不是节标题 我已经有了 我已经在界面生成器中设置了一个 XIB 所有的连接都已连接好并且运行良好 除了桌子没有给它足够的空间 我的问题是表格顶部与表格标题有一点重叠 我的 XIB
  • 为什么局部变量不设置为零?

    既然全局变量和静态变量默认初始化为0 为什么局部变量不默认初始化为0呢 因为这种零初始化需要执行时间 它会使你的程序明显变慢 每次调用函数时 程序都必须执行无意义的开销代码 这会将变量设置为零 静态变量在程序的整个生命周期中持续存在 因此您
  • GCC的sqrt()编译后如何工作?使用哪种root方法?牛顿-拉夫森?

    只是对标准感到好奇sqrt 来自 GCC 上的 math h 我自己编码的sqrt 使用牛顿拉夫森来做到这一点 是的 我知道 fsqrt 但CPU是如何做到这一点的呢 我无法调试硬件 现代 CPU 中的典型 div sqrt 硬件使用 2
  • 我试图根据 Prometheus 黑盒导出器的成功响应来计算 Grafana 的正常运行时间

    我尝试计算probe success的数量 并将其乘以探测间隔 试图获得以秒为单位的正常运行时间 并将值类型设置为总数 问题是随着时间范围的变化 最小步骤发生变化 无法给我们正确的读数并使该选项无效 我们实际上想做的是根据仪表板设置的时间范