为什么内存使用量比我在 Kubernetes 节点中设置的要大？

2024-03-30

我仅将资源分配给 1 个 pod，内存为 650MB/30%（对于其他内置 pod，限制内存仅为 69%）

然而，在 Pod 处理过程中，Pod 的使用量在 650MB 以内，但 Node 的总体使用率为 94%。

为什么会出现这种情况，因为它的上限应该是 69%？是不是其他内置pod没有设置限制的原因？如果内存使用率 > 100%，有时我的 pod 会出错，如何防止这种情况发生？

My allocation setting (kubectl describe nodes):

Memory usage of Kubernetes Node and Pod when idle:
kubectl top nodes

kubectl top pods

Memory usage of Kubernetes Node and Pod when running task:
kubectl top nodes

kubectl top pods

进一步测试的行为：
1. 准备命名空间下的deployment、pods和servicetest-ns
2. 因为只有kube 系统 and test-ns有 pod，因此为每个 pod 分配 1000Mi（从kubectl describe nodes) 目标小于 2GB
3. 假设内存使用于kube 系统 and test-ns会小于2GB，小于100%，为什么内存使用率可以是106%？

In .yaml 文件：

    apiVersion: v1
    kind: LimitRange
    metadata:
      name: default-mem-limit
      namespace: test-ns
    spec:
      limits:
      - default:
          memory: 1000Mi
        type: Container
    ---
    apiVersion: v1
    kind: LimitRange
    metadata:
      name: default-mem-limit
      namespace: kube-system
    spec:
      limits:
      - default:
          memory: 1000Mi
        type: Container
    ---
    apiVersion: apps/v1
    kind: Deployment
    metadata:
      name: devops-deployment
      namespace: test-ns
      labels:
        app: devops-pdf
    spec:
      selector:
        matchLabels:
          app: devops-pdf
      replicas: 2
      template:
        metadata:
          labels:
            app: devops-pdf
        spec:
          containers:
          - name: devops-pdf
            image: dev.azurecr.io/devops-pdf:latest
            imagePullPolicy: Always
            ports:
            - containerPort: 3000
            resources:
              requests:
                cpu: 600m
                memory: 500Mi
              limits:
                cpu: 600m
                memory: 500Mi
          imagePullSecrets:
          - name: regcred
    ---
    apiVersion: v1
    kind: Service
    metadata:
      name: devops-pdf
      namespace: test-ns
    spec:
      type: LoadBalancer
      ports:
      - port: 8007
      selector:
        app: devops-pdf

这种影响很可能是由该节点上运行的 4 个 Pod 引起的without指定的内存限制，显示为0 (0%)。当然0并不意味着它不能使用哪怕一个字节的内存，因为不使用内存就无法启动程序；相反，这意味着没有限制，可以使用尽可能多的东西。此外，不在 pod 中运行的程序（ssh、cron 等）也包含在总使用量中，但不受 kubernetes（cgroup）限制。

现在，kubernetes 以一种巧妙的方式设置内核 oom 调整值，以支持其内存下的容器request，使其更有可能杀死内存之间的容器中的进程request and limit，并使其最有可能杀死没有内存的容器中的进程limits。然而，这仅在长期运行中表现得相当好，有时内核可以杀死你最喜欢的容器中表现良好的你最喜欢的进程（使用少于其内存的进程）request). See https://kubernetes.io/docs/tasks/administer-cluster/out-of-resource/#node-oom-behavior https://kubernetes.io/docs/tasks/administer-cluster/out-of-resource/#node-oom-behavior

在这种特殊情况下，没有内存限制的 pod 来自 aks 系统本身，因此在 pod 模板中设置其内存限制不是一个选项，因为有一个协调器将恢复它（最终）。为了解决这种情况，我建议您在 kube-system 命名空间中创建一个 LimitRange 对象，该对象将为所有 pod 分配内存限制，而没有限制（在创建它们时）：

apiVersion: v1
kind: LimitRange
metadata:
  name: default-mem-limit
  namespace: kube-system
spec:
  limits:
  - default:
      memory: 150Mi
    type: Container

（您需要删除已经存在的Pods没有内存限制才能生效；他们将被重新创建）

这并不能完全消除问题，因为您最终可能会遇到过度使用的节点；然而，内存使用将是有意义的，并且 oom 事件将更可预测。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

为什么内存使用量比我在 Kubernetes 节点中设置的要大？的相关文章

从我的应用程序 Helm 图表配置第三方 Helm 图表

我似乎在任何地方都找不到任何关于此的明确信息但是 Helm 图表中是否有可能需要第三方例如stable jenkins 并指定配置值我看到的所有示例都是为了运行helm install直接命令但我希望能够将其配置为我的应用程序的一部
如何使用fabric8 java客户端获取kubernetes服务帐户访问令牌？

我已经在本地计算机中配置了 minikube 并将在外部使用 kubernetes 我已经在 kubernetes 中创建了一个服务帐户并使用它的秘密我可以使用以下命令获取访问令牌 kubectl get secret
如何在独占节点中运行两个 Pod？

我想在独占节点中运行两个 Pod 例如我有 4 个节点 node 1 node 2 node 3 node 4 和 2 个 pod pod 1 pod 2 我希望每个节点中只运行一个 pod 并且每个 pod 运行在两个节点中例如pod
Windows 持久卷上的 Kubernetes

Windows minikube 是否支持带有主机路径的持久卷如果是这样语法是什么 I tried apiVersion v1 kind PersistentVolume metadata name kbmongo002 labels
Kubernetes Pod 中的日志未显示

我在 pod 中设置了 Kubernetes 并运行 grpc 服务我成功命中服务上的端点其中有 print 语句但我在日志文件中没有看到任何日志我之前在 Kubernetes 中运行 cron 作业时见过这种情况并且日志仅在作业
在 Kubernetes 中连接前端和后端

我的前端设置为 this http post
容器上的“container_memory_working_set_bytes”指标和 OOM-killer 之间有什么关系？

我试图找出并理解 OOM killer 如何在容器上工作为了弄清楚这一点我读了很多文章发现 OOM killer 会根据oom score And oom score是由oom score adj以及该进程的内存使用情况有两个指标c
如何使用网络策略停止所有外部流量并仅允许命名空间内的 Pod 间网络调用？

我正在 kubernetes 集群中设置一个命名空间以拒绝任何传出网络调用例如http company com http company com但允许在我的命名空间内进行 Pod 间通信例如http my nginx http my
在扩大或缩小 StatefulSet 之前停止 StatefulSet 中的所有 Pod

我的团队目前正在致力于将 Discord 聊天机器人迁移到 Kubernetes 我们计划使用一个有状态集对于主要的机器人服务因为每个Shard https discord com developers docs topics gatew
如何在Prometheus中查询容器内存限制

我正在使用 Prometheus 工具来监控我的 Kubernetes 集群我在部署中设置了资源限制内存限制并且需要配置一个面板来显示可用的总内存请让我知道在 Prometheus 中运行以获得可用于我的部署的总内存限制所需的查询
Kubernetes 集群中的 Websocket 连接与 nginx-ingress

我正在尝试在 Kubernetes 集群中运行的服务器上建立一个简单的 Websocket 连接 Websocket 连接能够在我的本地测试计算机上建立但在使用 nginx ingress 部署到 GKE 后我无法将客户端连接到服务器
kubectl 部署失败

我正在为 GKE 上的 Spring boot 应用程序设置 CI CD 管道 CI 构建步骤工作正常但交付构建步骤由于错误没有对象传递到应用错误而失败我可以在云构建中看到以下日志 Starting Step 0 Deploy S
更新到版本 2.1.1.0 Edge（或稳定版）后，Windows 版 Docker 停留在“Kubernetes 正在启动”状态

我最近在 Windows 10 计算机上将 Docker for Desktop 更新到最新的 Edge 通道版本 2 1 1 0 不幸的是更新后 Kubernetes 不再工作因为它始终停留在 Kubernetes 正在启动到目前为
如何在 Apache Airflow 中混合使用 Celery Executor 和 Kubernetes Executor？

我有多个使用 Celery Executor 的 dag 但我希望使用 Kubernetes Executor 运行一个特定的 dag 我无法推断出一种良好且可靠的方法来实现这一目标我有一个airflow cfg我在其中声明了Celery
如何在minikube中创建多个集群

我需要在 minikube 中创建额外的集群我搜索了一段时间没有找到任何这方面的资源如何在 minikube 中创建集群创建第一个名为cluster 1 minikube start p cluster 1 创建第二个集群名称为cl
如何使用同一 k8s 集群内的 kubectl exec 从另一个 pod 中的一个 pod 执行命令

我在一个集群中有两个 Pod 让我们称它们为 A 和 B 我已经在 pod A 中安装了 kubectl 并且尝试使用 pod A 在 pod B 中运行命令kubectl exec it podB bash 我收到以下错误 Error f
启动 pods-kubernetes 时出错。 Pod 仍处于 ContainerCreating 状态

我已经在运行 ubuntu 的桌面上安装了带有 minikube 的 kubernetes 试用版然而启动 Pod 似乎存在一些问题 Kubectl get pods all namespaces 显示所有处于 ContainerCre
kubernetes + coreos 集群 - 替换证书

我有一个 coreos kubernetes 集群我是按照这篇文章开始的 AWS 上的 kubernetes coreos 集群 https coreos com kubernetes docs latest kubernetes on
Kubernetes，无法访问其他节点服务

我正在 3 个带有 CentOS 7 的 VirtualBox 虚拟机 1 个 master 和 2 个 minions 中使用 Kubernetes 不幸的是安装手册说的是这样的every service will be accessib
如何使用 kubectl cp 通过列表过滤器自动将文件从本地系统复制到 kubernetes Pod

我的 kubernetes 系统中有许多 pod 随机名称为 wordpress xxx xx 这里列出了pods https i stack imgur com k7Jxw png 我想使用一个命令kubectl cp另一种是将文件从一个

随机推荐

在运行时创建实例变量

我想在运行时动态创建实例变量并且想将这些变量添加到类别中实例变量的数量可能会根据我用于定义它们的配置属性文件而变化有任何想法吗 Use 关联参考 http developer apple com library ios docume
从 Angular 访问 webapi 时出现 401 未经授权的错误

当用户访问我的 webapi 应用程序时我需要捕获用户的域用户名在我的开发机器上我的 webapi 位于localhost 10570和我的 angularjs 网站它调用网络服务localhost 34575 如果我直接调用我的
xUnit 和 Moq 不支持 async -await 关键字

我正在尝试探索如何将 async 和 wait 关键字应用到我的 xUnit 测试中我正在使用 xUnit 1 9 和 Async CTP 1 3 这是我的测试用例我有一个接口它指定一个异步方法调用 public interface
如何使用 pytest-mock 或 magicmock 模拟导入的对象

我正在尝试理解mock monkeypatch pytest mock能力让我知道这是否可能如果没有请建议我如何测试此代码我的代码结构 app init py some module1 init py some module2 in
使用 xmlagg 函数的 SQL 多个 SELECT 查询 - 未按所需方式提取数据

我在Oracle中的数据是这样的 NAME DEP VALUE ID DEP Amy 1 AA1234 Bob 2 BB4321 Clara 1 CC5678 Clara 2 CC7890 John 1 JJ6543 John 2 JJ78
在 GKE 集群上使用 Terraform 部署 Helm 工作负载

我正在尝试使用 Terraform Helm 提供程序 https www terraform io docs providers helm index html https www terraform io docs providers
Python pygame exe 构建时出现 cx_freeze TCL_LIBRARY 错误

我正在关注这个教程here https www youtube com watch v HosXxXE24hA在 pygame 中制作贪吃蛇游戏这是我的 setup py 代码 import cx Freeze executables c
我如何使用 ruby 驱动程序知道 MongoDB 中文档的大小

MongoDB 中一份文档的限制是 4Mo 我有一些包含大量数据的文档我如何使用 ruby 驱动程序知道 MongoDB 中文档的大小或者原生的 Object bsonsize db Foo findOne
在 Visual Studio 2010 中链接 boost 库时出现问题。

我根据找到的指南编译了我的boost库here https stackoverflow com questions 2629421 how to use boost in visual studio 2010并尝试使用 boost 文件系统
通过 Firefox WebDriver 处理“下载”窗口

我正在尝试 Firefox 的 WebDriver 我想问一下是否可以处理下载窗口接受或拒绝传入的下载请求例如一段简单的代码 import selenium firefox webdriver dr selenium firefox
如何获得 Podio APP 响应细节级别 mini、micro 或 Short？

在 Podio API 文档的许多地方您似乎可以指定响应中的详细程度完整短迷你微例如在 Get App 调用中https developers podio com doc applications get app 22349 h
如何从颠倒的钟形曲线中采样

我可以使用下面的代码生成均匀分布的数字 runif 1 min 10 max 20 如何对更频繁地接近最小和最大边界的随机生成的数字进行采样又名颠倒的钟形曲线钟形曲线通常是高斯曲线这意味着它没有最小值和最大值你可以尝试贝塔分布 h
在 Angular (4) 应用程序组件中包含外部 css

So from 将外部 css 样式加载到 Angular 2 组件中 https stackoverflow com questions 34542143 load external css style into angular 2 co
在 act 回调中包装异步 moxios 调用

我正在尝试使用钩子测试反应功能组件 useEffect 挂钩调用第三方 API 然后在返回时调用 setState 我已经进行了测试但不断收到警告表明组件的更新未包含在 act 中我遇到的问题是期望位于 moxios wait 承诺内
“游戏中心无法识别该游戏”错误

我正在努力度过游戏中心集成工作的第一阶段到目前为止我已经做到了我创建了一个新的干净的应用程序在应用程序委托中添加了 GameKit 标头和基本的authenticateWithCompletionHandler 方法在模拟器中启动
Lua：C++模块无法互相引用，未定义的符号

我创建了两个模块共享对象 CPU 和 SaveState 作为模拟器的一部分两者都独立编译成 so 单独文件并在运行时由 Lua 脚本使用 require 加载 IE SaveState require SaveState CPU r
Git 无法解释地更改单个文件的权限

我是唯一参与这个 git 项目的人每次我在本地 Ubuntu 存储库中编辑文件然后推送到 Bitbucket 并拉取到我的生产存储库时 git 都会将编辑的文件更改为 rwxrwxr x 775 Apache 不喜欢这样本地系统 Ub
从 Python 设置 gzip 时间戳

我对使用 Python 压缩数据感兴趣gzip模块碰巧我希望压缩输出是确定性的因为这对于一般事物来说通常是一个非常方便的属性如果某些不支持 gzip 的进程要寻找输出中的更改或者如果输出将被加密签名不幸的是每次的输出都不同据我
是否可以在Android中使用phoneGap在SD卡中加载/创建数据库？

如何使用phoneGap 或任何与phoneGap 配合使用的插件从sdcard 加载现有的 db 文件或在sdcard 中创建数据库我想将 db 文件保存在 SD 卡中因为数据库的大小可能会增加我面临同样的问题但经过长时间彻底阅读
为什么内存使用量比我在 Kubernetes 节点中设置的要大？

我仅将资源分配给 1 个 pod 内存为 650MB 30 对于其他内置 pod 限制内存仅为 69 然而在 Pod 处理过程中 Pod 的使用量在 650MB 以内但 Node 的总体使用率为 94 为什么会出现这种情况因为它的上限

为什么内存使用量比我在 Kubernetes 节点中设置的要大？

为什么内存使用量比我在 Kubernetes 节点中设置的要大？ 的相关文章

随机推荐

热门标签

为什么内存使用量比我在 Kubernetes 节点中设置的要大？的相关文章