在高资源需求 pod 上，节点状态更改为未知

2024-03-06

我有一个 Jenkins 部署管道，其中涉及 kubernetes 插件。使用 kubernetes 插件，我创建了一个从属 Pod，用于使用以下命令构建节点应用程序：yarn。设置 CPU 和内存的请求和限制。

当 Jenkins master 调度 Slave 时，有时（到目前为止我还没有看到任何模式），Pod 会使整个节点无法访问，并将节点状态更改为 Unknown。在 Grafana 中仔细检查后，CPU 和内存资源似乎完全在范围内，没有明显的峰值。唯一出现的峰值是磁盘 I/O，峰值约为 4 MiB。

我不确定这是否是节点无法将自己定位为集群成员的原因。我在这里需要一些帮助：

a) 如何深入诊断节点离开集群的原因。

b) 如果原因是磁盘 IOPS，那么 Kubernetes 级别是否有任何默认请求和 IOPS 限制？

PS：我使用的是EBS（gp2）

根据docs https://kubernetes.io/docs/concepts/architecture/nodes/#condition，使节点处于“就绪”状态：

如果节点健康并准备好接受 Pod，则为 True；如果节点不健康且不接受 Pod，则为 False；如果节点控制器在最后一个节点监控宽限期内没有收到来自节点的消息，则为 Unknown（默认为40秒）

当您运行工作负载时，您的 kube-apiserver 似乎在 40 秒内没有收到您的节点 (kubelet) 的消息。原因可能有多种，您可以尝试以下一些操作：

要查看节点中的“事件”，请运行：
```
$ kubectl describe node <node-name>
```
查看 kube-apiserver 上是否发现任何异常情况。在您的活动主机上运行：
```
$ docker logs <container-id-of-kube-apiserver>
```
查看当您的节点进入“未知”状态时，您是否在 kube-controller-manager 上看到任何异常情况。在您的活动主机上运行：
```
$ docker logs <container-id-of-kube-controller-manager>
```
增加--node-monitor-grace-periodkube-controller-manager 中的选项。您可以将其添加到命令行中/etc/kubernetes/manifests/kube-controller-manager.yaml并重新启动kube-controller-manager容器。
当节点处于“未知”状态时，您可以ssh进去看看你是否能到达kubeapi-server？两者都开启<master-ip>:6443还有kubernetes.default.svc.cluster.local:443端点。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

在高资源需求 pod 上，节点状态更改为未知的相关文章

应用程序网关如何防止请求发送到最近终止的 Pod？

我目前正在 Azure 中研究和试验 Kubernetes 我正在使用 AKS 和应用程序网关入口据我了解当 Pod 添加到服务时端点会更新入口控制器会不断轮询此信息随着新端点的添加 AG 也会更新当它们被移除时 AG 也被更新
nslookup 无法在最新的 busybox 上获取服务 ip

重现步骤 kubectl run busybox1 generator run pod v1 image busybox 1 28 sleep 3600 kubectl run busybox2 generator run pod v1 i
Kubernetes Pod 中的日志未显示

我在 pod 中设置了 Kubernetes 并运行 grpc 服务我成功命中服务上的端点其中有 print 语句但我在日志文件中没有看到任何日志我之前在 Kubernetes 中运行 cron 作业时见过这种情况并且日志仅在作业
在 Kubernetes 中连接前端和后端

我的前端设置为 this http post
如何使用网络策略停止所有外部流量并仅允许命名空间内的 Pod 间网络调用？

我正在 kubernetes 集群中设置一个命名空间以拒绝任何传出网络调用例如http company com http company com但允许在我的命名空间内进行 Pod 间通信例如http my nginx http my
oauth2-proxy 身份验证调用在 kubernetes 集群上运行缓慢，并带有 nginx 入口的身份验证注释

我们使用以下描述的方法在 K8S 集群上保护了一些服务的安全这一页 https kubernetes github io ingress nginx examples auth oauth external auth 具体来说我们有 ng
Docker For Windows CE：Kubernetes：无法连接到服务器 eof

我根本找不到无法连接到服务器 eof 的解决方案希望我们能解决这个问题并在将来搜索解决此问题时对某人有所帮助我试图在屏幕截图中包含所有信息如果需要更多信息请告诉我我已尝试添加所需的信息如果您还需要或希望我尝试其他内容请告诉
如何在Prometheus中查询容器内存限制

我正在使用 Prometheus 工具来监控我的 Kubernetes 集群我在部署中设置了资源限制内存限制并且需要配置一个面板来显示可用的总内存请让我知道在 Prometheus 中运行以获得可用于我的部署的总内存限制所需的查询
为什么不推荐多区域 Kubernetes 部署？

Kubernetes 文档说支持多区域集群但不支持多区域集群同时 Kubernetes 都支持failure domain zone and failure domain region 让我的 Kubernetes 集群同时成为多专区和
Kubernetes Python 客户端连接问题

我已经设置了官方 Kubernetes Python 客户端 https github com kubernetes client python https github com kubernetes client python 我正在运行
kubernetes master 的 x509 证书无效

我正在尝试从我的工作站访问我的 k8s master 我可以从 LAN 很好地访问主站但不能从我的工作站访问错误信息是 kubectl context employee context get pods Unable to connec
启动 pods-kubernetes 时出错。 Pod 仍处于 ContainerCreating 状态

我已经在运行 ubuntu 的桌面上安装了带有 minikube 的 kubernetes 试用版然而启动 Pod 似乎存在一些问题 Kubectl get pods all namespaces 显示所有处于 ContainerCre
列出命名空间中的所有资源

我想查看命名空间中的所有资源 Doing kubectl get all尽管有名称但不会列出服务和入口等内容如果我知道类型我可以明确要求该特定类型但似乎也没有用于列出所有可能类型的命令尤其kubectl get例如不列出自定义类
Azure Kubernetes 服务 (AKS) 使用应用程序网关入口控制器 (AGIC)：如何在 ASP.Net Core 6.0 中实现 HSTS 标头？

一个行动项目来自安全扫描是为了实施HSTSASP Net Core 6 0 WebAPI 中的标头使用应用程序网关入口控制器在 AKS 上部署 WebAPI 应用程序 SSL 终止发生在应用程序网关处应用程序网关入口控制器和 POD 使
在 Jenkins 中执行批处理文件

我有一个简单的批处理文件我想要从 Jenkins 调用运行执行该文件 Jenkins 中有同样的插件吗如何从 Jenkins 执行批处理文件如果有相同的教程或文档无需为此添加新插件在Jenkins 选择您的工作名称并转到配置部
如何使用 kubeadm 升级来更改 kubeadm-config 中的某些功能

我想在现有的 kubernetes 集群 v1 10 上安装 kube prometheus 在此之前文档说我需要将控制器调度器的IP地址从127 0 0 1 to 0 0 0 0 并且还推荐使用kubeadm 配置升级 https k
在 Kubernetes 中什么是删除集合？

列出 K8s 中的所有 API 资源时您会得到 kubectl api resources owide NAME SHORTNAMES APIGROUP NAMESPACED KIND VERBS bindings true Bindin
Kubernetes - 一个 Ingress 中的多个配置

我在同一个 Kubernetes 集群中运行不同的应用程序我希望多个域能够访问我的 Kubernetes 集群并根据域进行重定向对于每个域我想要不同的注释配置如果没有注释我的入口部署如下 apiVersion networki
如何使用 withParam 引用在 DAG 外部创建的 sys.stdout 以在 DAG 内部使用？

我正在使用 Argo 工作流程我的中有一个 DAG 步骤entrypoint这遵循几个正常步骤其中一个步骤执行sys stdout 进入 DAG 步骤后我希望某些任务引用 DAG 步骤的结果sys stdout 我知道我们是否想参考s
等待 pod 附加或挂载卷的超时已过期

我在裸机上的 ubuntu 上安装 kubernetes 我部署了1个master和3个worker 然后部署 rook 一切工作正常但是当我想在其上部署 wordpress 时我收到此错误无法为 Pod 挂载卷 wordpress

随机推荐

DOM 环境中什么时候会发生回流？

哪些活动会触发带有 DOM 的网页重排似乎有不同的观点根据http www nczonline net blog 2009 02 03 speed up your javascript part 4 http www nczonline
如何在jsp中显示Spring Security身份验证异常的自定义错误消息

我想在 jsp 中显示 spring 安全身份验证异常的自定义错误消息如果用户名或密码错误 spring displays Bad credentials what I need Username Password entered is
在透明背景上制作不透明文本渐变

它应该看起来像http img190 imageshack us img190 1686 textgradient jpg http img190 imageshack us img190 1686 textgradient jpg 棘手的
在Windows上使用sdkmanager安装android命令行工具

我正在尝试在 Windows 上使用 sdkmanager 安装 Android 命令行工具以便在 SAP Web IDE 中进行混合 Android 应用程序开发另外我位于代理网络下当我尝试通过以下命令使用 cmd 设置代理时 s
如何调试 System.Web.Mvc.MvcHandler 上的 500.0 / 0x00000000 错误

我收到这个奇怪的错误我无法弄清楚在 Windows 8 1 IIS 8 5 上运行该网站在 Microsoft Azure 上运行良好因此肯定是本地配置问题我在 IIS Express 中遇到的错误与在 IIS 中遇到的错误相同
iOS-获取目录中文件大小的总和

我使用以下代码来缓存从 Flickr 加载到设备内存中的照片 NSURL urlForPhoto FlickrFetcher urlForPhoto self photo format FlickrPhotoFormatLarge NSSt
使用自定义部分覆盖模板

我正在尝试从自定义部分覆盖我的默认模板我正在使用代码来执行此操作但是如果我使用它我无法将模板分配到编辑页面页面任何人都可以知道自定义部分如何和编辑页面分配模板工作我想在创建页面时设置模板并在分配它后我想覆盖它假设我有一个博客页
提高优化级别 g++

我正在尝试使用 cygwin 和 g 编译一个相对简单的 C 程序我可以使用以下命令编译它 g o main main cpp lgmpxx lgmp 注最后两个反映了 gmp 库的包含我想提高编译时的优化级别我想我可以将此命令行更
Android mediaScannerConnection.scanFile 无法刷新图库中的图像

我是否应该使用 MediaScannerConnection scanFile 方法以外的方法来刷新图库保存新的 jpg 后我运行媒体扫描仪来刷新图库应用程序如下所示 MediaScannerConnection scanFile t
git subtree：可以更改分叉存储库中的子树分支/路径吗？

在存储库中A文件夹sub作为存储库的 git 子树包含在内S 指向master branch 我已经分叉了存储库A into F 现在我想执行以下操作之一F change sub使用不同的分支S ie develop branch 或改变
初学者：如何使用 Pantheios 日志 API 库替代 #ifdef DEBUG？如何定义SEVLEVEL？

我想在动态搜索算法中记录很多事件例如有关收敛到全局最优的信息此日志记录应该有一个开关来关闭打开它现在有很多可能性可以实现这一目标实现算法的日志版本和非日志版本 gt 冗余使用宏 gt 丑陋而且不安全使用 C 日志库或者使
Android 应用中的 GridView 与 GridLayout

我必须使用网格在 Android 中实现照片浏览器所以我想知道GridView 和 GridLayout 之间的区别这样我就会选择正确的一个目前我正在使用 GridView 动态显示图像 A GridView http develo
SQL SMO - 检查用户是否是服务器管理员

我想检查连接的用户是否是 SQL Server 管理员处于 sysadmin 角色并想知道这是否是最好的方法 private static bool IsUserAdmin Server server Login login serve
带有两个并排的 UITableViewController 的 iPhone 应用程序

我正在尝试构建一个带有两个并排表格的 iPhone 应用程序其中两个表格始终可见且可单独滚动这可能吗我在这个网站上阅读了许多类似问题的答案人们建议使用两个 UITableViewController 并排听起来正是我需要的但我
卡夫卡 + AWS lambda

是否可以将 AWS Lambda 与 Apache Kafka 集成我想将消费者放入 lambda 函数中当消费者收到消息时 lambda 函数就会执行继续阿拉法特的观点我们已经成功构建了一个基础设施可以使用 AWS Lambda
无法为 kubelet 构造 api.Node 对象：无法从云提供商获取外部 ID：无法找到对象

尝试使用 OpenStack 上的 Cinder 卷作为我的 Pod 的持久卷一旦我配置了 cloudprovider 并重新启动 kubelet kubelet 就无法从云提供商获取其外部 ID 可使用 comodo 证书通过 http
内核线程转储中的“isra”是什么

Linux 内核调用堆栈转储通常包含以 isra NNN 结尾的函数名称其中 NNN 是一些数字例如参见here https bbs archlinux org viewtopic php pid 1324638 p1324638 a
在 R 中查找变量的类

所以我在 R 方面遇到了这个问题我有一个表我需要找到变量的类是什么即我假设它指的是列中的数据数据相当大即很多行每当我写作时class nameofthedata 它不起作用每当我写作时class titleofthecolum
如何使用 JMeter 和 Firefox 修复问题“错误代码：SEC_ERROR_UNKNOWN_ISSUER”

我已经安装了 JMeter 和 Firefox 当我录制脚本时它会抛出一个Error code SEC ERROR UNKNOWN ISSUER我已经在 Firefox 和系统中安装了证书我正在使用 Windows 机器并使用 JMete
在高资源需求 pod 上，节点状态更改为未知

我有一个 Jenkins 部署管道其中涉及 kubernetes 插件使用 kubernetes 插件我创建了一个从属 Pod 用于使用以下命令构建节点应用程序 yarn 设置 CPU 和内存的请求和限制当 Jenkins mast

在高资源需求 pod 上，节点状态更改为未知

在高资源需求 pod 上，节点状态更改为未知 的相关文章

随机推荐

热门标签

在高资源需求 pod 上，节点状态更改为未知的相关文章