我可以使用 Google Cloud Monitoring 来监控发生故障的 Container/Pod 吗?

2024-02-05

尝试Google Cloud Monitoring- 当容器或 Pod 出现错误、无法调度等情况时,我正在努力使用开箱即用的指标创建警报。监控我的应用程序是否健康的非常基本的东西。使用 Prometheus 进行配置非常容易。

有一种称为“GKE 容器”的资源类型,但它主要包含 CPU 和内存使用情况等基本内容。还有一种名为“Kubernetes Pod”的资源类型,但该资源类型仅包含标记为kubernetes.io/anthos并且所有指标/时间序列都是空的。

这是 Google 故意遗漏的吗?即我需要自己部署一些东西?我对 Google Cloud Monitoring 的希望是我不需要像 Prometheus 那样部署和配置那么多东西 - 毕竟它是一项付费服务​​。


目前,GKE 默认不导出此数据。您可以使用 Kube-state-metric 以 Prometheus 格式导出数据。https://github.com/kubernetes/kube-state-metrics https://github.com/kubernetes/kube-state-metrics有办法提供很多这样的指标。您可以使用 Prometheus-to-stackdriver 导出器提取此数据信息 Stackdriver。您可以点击此链接:https://cloud.google.com/monitoring/kubernetes-engine/prometheus https://cloud.google.com/monitoring/kubernetes-engine/prometheus.

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

我可以使用 Google Cloud Monitoring 来监控发生故障的 Container/Pod 吗? 的相关文章

  • 如何在 stackdriver 中针对每个错误创建警报

    创建了基于日志的指标云控制台 https console cloud google com logs metrics 然后我想创建警报 以便每次有新的匹配日志条目时都会触发警报 在尝试创建合适的指标时 最有可能的选项似乎是阈值或变化率 但我
  • 如何增加 google kubernetes 引擎上主节点的大小?

    我正在寻找一种增加 GKE 上主节点虚拟机大小的方法 On https kubernetes io docs admin cluster large size of master and master components https ku
  • 暴露 Google Container Engine 中的两个端口

    是否可以在 Google 容器引擎中创建一个公开两个端口的 Pod 端口 8080 正在侦听传入内容 端口 80 将此内容分发给客户端 Google 给出了以下创建 Pod 的命令作为示例 kubectl run hello node im
  • .kube/config 中没有访问令牌

    在 GKE 中升级集群后 仪表板将不再接受证书身份验证 我的同事说 没问题 kube config 中有一个可用的令牌 user auth provider config access token REDACTED cmd args con
  • 如何在云监控/stackdriver中按状态显示总dataproc作业?

    Dataproc 作业中应该有成功 失败 待处理状态 当然我可以在 Cloud Console 上 Dataproc 下的作业部分中看到该状态 但是 如何在云监控 stackdriver 中可视化所有这些状态 已经尝试过记分卡图表并使用指标
  • 使用 AWS Elastic LoadBalancer 公开 kubernetes 应用程序

    我创建了一个内部 AWS 弹性应用程序负载均衡器 并在 AWS 控制台中将其状态显示为活动 请注意 我使用 jenkins 作业创建了此 ALB 并且在该作业中我指定了我的 AWS EC2 实例服务器 该服务器配置为我的 kubernete
  • 在 GKE 下时拒绝EscalatingExec

    我们将 GKE 与 Kubernetes 集群结合使用 我们正在运行的应用程序之一是 Jenkins for CI 不幸的是 Jenkins Slave 需要使用 Docker 来挂载其主机的docker sock 这可能是一种升级漏洞 解
  • 如何在 kubernetes 应用程序上获取 ssl?

    我在 kubernetes 上部署了一个简单的流星应用程序 我将外部 IP 地址与服务器关联起来 以便可以从集群内部访问它 现在 我准备将其公开到互联网并保护它 使用 HTTPS 协议 谁能为这部分提供简单的说明 在我看来库贝乐高 http
  • 如何更新 Kubernetes 中的 api 版本列表

    我尝试在我的配置中使用 autoscaling v2beta2 apiVersion 如下本教程 https kubernetes io docs tasks run application horizontal pod autoscale
  • Runtime.getRuntime().availableProcessors() 在容器优化操作系统上始终返回 1

    我正在 GCP 上的 kubernetes 引擎上部署 Elasticsearch 但遇到了性能问题 Elasticsearch根据核心数量确定各种线程池的大小 尽管我创建了一个 32 核 VM 但线程池大小仅为 1 我确实编写了一个测试程
  • GKE Pod 连接到同一子网中的外部虚拟机

    我有一个 pod 需要连接到位于 GCE 虚拟机上的数据库 该数据库与 GKE 节点具有相同的子网 我目前有一个 k8 服务和 k8 端点 pod 已成功连接到 但无法路由 10 128 0 2 我确信这与 GCP 防火墙规则 路由有关 但
  • 如何为 GKE 服务创建 Google CDN

    我已经在 GKE kubernetes 上部署了一个 WordPress 网站 我可以像 mysite test com 这样从互联网访问我的网站 并且工作起来就像一个魅力 现在我想使用Google CDN来加速访问 我尝试过使用 Ingr
  • 更改 GKE 上的 kubernetes 主环境变量

    我想在 GKE 上使用我的 Kubernetes 集群启用 Stackdriver 日志记录 这里有说明 https kubernetes io docs user guide logging stackdriver https kuber
  • 如何使用 PersistentVolumeClaim 在 Deployment/Pod 上挂载持久卷?

    我正在尝试在 Pod 上安装持久卷 通过部署 apiVersion apps v1 kind Deployment spec template spec containers image volumeMounts mountPath app
  • 将代码/文件直接注入 Google Cloud Engine 上的 Kubernetes 容器中

    如何将代码 文件直接注入 Google Cloud Engine 上的 Kubernetes 容器中 类似于使用 Docker 挂载主机文件 目录的方式 例如 docker run d name nginx p 443 443 v ngin
  • 如何在minikube中创建多个集群

    我需要在 minikube 中创建额外的集群 我搜索了一段时间没有找到任何这方面的资源 如何在 minikube 中创建集群 创建第一个名为cluster 1 minikube start p cluster 1 创建第二个集群 名称为cl
  • 无法连接到代理“证书由未知机构签名”

    我正在尝试通过 Kubernetes 部署上的 cloudsql proxy 容器连接到 CloudSQL 实例 我已安装 cloudsql 凭据以及值GOOGLE APPLICATION CREDENTIALS set 但是 我的日志中仍
  • 如何在 GKE 上为 Kubernetes Ingress 强制使用 SSL

    有没有办法强制对入口负载均衡器上的传入连接进行 SSL 升级 或者 如果这是不可能的 我可以禁用端口 80吗 我还没有找到一个好的文档页面来概述 YAML 文件中的此类选项 预先非常感谢 https github com kubernete
  • Helm 查找始终为空

    在部署 Kubernetes 应用程序时 我想检查资源是否已存在 如果是这样 则不应渲染 要存档此行为查找功能 https helm sh docs chart template guide functions and pipelines
  • 获取第三方应用程序的谷歌云正常运行时间历史记录

    我正在尝试将我的应用程序 托管在谷歌云中 的正常运行时间历史记录转移到我自己的页面 谷歌云上有api吗 我只需要获取日期和上涨 下跌百分比或时间 我已经在谷歌控制台上配置了正常运行时间检查 但我需要将其集成到我的应用程序中 是的 您可以 但

随机推荐