【故障排查】dig通过coredns的svc IP，解析pod的fqdn出现connection timed out； no servers could be reached

2023-05-16

环境信息：

#另一个环境
master1 、master2 、node1 、 node2     k8s 1.22 、 docker 、calico、 node2上有kuboard

问题描述：

dig通过coredns的svc IP，解析pod的fqdn出现connection timed out； no servers could be reached
在这里插入图片描述

最终处理方法：

删掉node2上的kuboard创建的网络。
在这里插入图片描述

正常的状态： node2也有去往calico的路由信息了

造成“故障”的操作为：

至于为啥会故障/冲突，似懂非懂。（在创建了docker网络的情况下。容器不会走docker0的？！），node2有两个bridge
在这里插入图片描述

排查方法（***）：

总结下排查方法/思路
在这里插入图片描述

根据报错的提示，开始认为是coreDNS出了问题，最终是node2节点上calico插件出了问题。下面通过种种现象来复盘
在这里插入图片描述

0、看日志 cat /var/log/messages 和systemctl status kubelet

查看 /var/log/messages 和systemctl status kubelet -l
kubectl logs 
kubectl describe
但本次报错信息有丶抽象。

在这里插入图片描述

注意：coreDNS需要修改configmap，打开log模块，加上log{} ，才会显示出具体日志。
在这里插入图片描述

1、对比法rount -n

对比不同节点的rount -n 内容，对比找不同。
在这里插入图片描述

2、从内到外法

在node2使用ping和dig。发现coreDNS服务是OK，所以兜兜转转后，还是calico的问题。
在这里插入图片描述

3 、ping coreDNS的POD IP 和使用dig coreDNS的POD IP

svc到负载的每个pod ip
在这里插入图片描述

ping  coredns的POD IP 
正常的情况是都能ping通的（master、node1 、node2）

3.1、master节点操作 ping

在这里插入图片描述

node1的coreDNS日志：
在这里插入图片描述
node2的coreDNS还是没日志

3.2、使用dig coreDNS的POD IP

在这里插入图片描述

4、tcpdump抓包排查法（node2操作）

没日志，而且ping不通，说明请求压根没到，在node02 tcpdump试试
tcpdump -i any -nn -s 0 icmp or port 53 -v

在这里插入图片描述

小结

k8s网络方面故障，看docker network 、 calico 、 coreDNS 、 rount -n

感谢PD， oldxu群里面的高手们。如果不是本人，可能看文章感觉有丶乱，

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

dig

coredns

svc

pod

fqdn

【故障排查】dig通过coredns的svc IP，解析pod的fqdn出现connection timed out； no servers could be reached 的相关文章

kubeadm部署k8s，coredns一直处于containercreating状态failed to find plugin “flannel“ in path [/opt/cni/bin]]

问题 xff1a coredns始终处于containercreating状态 coredns镜像拉取不下来 xff0c 只能手动拉去之后修改tag进行解决这个问题 xff0c 具体步骤如下 xff1a span class token n
Cortex-M3利用SVC中断调用系统服务的例子

SVC xff08 系统服务调用 xff0c 亦简称系统调用 xff09 和PendSV xff08 可悬起系统调用 xff09 xff0c 它们多用在上了操作系统的软件开发中 SVC用于产生系统函数的调用请求例如 xff0c 操作系统通
k8s 中 pod 之间的通信

1 pod 内部通信 xff1a 通过 localhost 通信 2 同节点不同 pod 之间通信 xff1a 通过 linux 虚拟以太网设备或者是用两个虚拟接口组成的以太网接口对不同的网络命名空间连接起来通信 3 不同节点的不同 pod
玩转k8s（四）—— 通过Service访问Pod

我们不应该期望k8s Pod是健壮的 xff0c 而是要假设Pod中的容器很可能因为各种原因发生故障而死掉 Deployment等Controller会通过动态的创建和销毁Pod来保证应用整体的健壮性换句话说 xff0c Pod是脆弱的
【stm32】 OS 支持特性之 PendSV 异常和 SVC异常

1 SVC和PENDSV 基本概念 SVC xff08 系统服务调用 xff0c 亦简称系统调用 xff09 和 PendSV xff08 可悬起系统调用 xff09 xff0c 它们多用于在操作系统之上的软件开发中 SVC 用于产生系统函
k8s: pod volume的用法

k8s版本 xff1a 1 22 apiVersion v1 kind Pod metadata name volume hostpath namespace dev spec containers name nginx image ngi
在Pod中执行目录操作，提示Permission denied

问题 xff1a 进入Pod执行创建文件的操作 xff0c 出现如下报错 kubectl exec it jenkins 5b688ddcc7 h72f2 n cicd bash touch test touch cannot touch
k8s 1.23.10 动态POD扩缩容（HPA ）

目录为什么要自动扩缩容 xff1f 再K8S中扩容分为两种 xff1a 一 Node层面 xff1a 二 Pods层面 xff1a 自动扩缩容的方案有哪些 Kubernetes HPA xff08 Horizontal Pod Autos
pod install 报错 [!] Oh no, an error occurred.

今天在写react native与原生Swift交互的demo时新建了一个xcode工程SwiftRnApp执行pod install时报错点开上面的链接查看CocoaPods issues 说是要把xcodeproj的版本更新到 1
IOS 解决安装POD报You don't have write permissions for the /usr/bin directory的错误

这段时间开始做IOS开发使用pod管理第三方库由于一些第三方不兼容最新的pod 所以要安装旧版本的pod 其中遇到的问题就是 You don t have write permissions for the usr bin direct
iOS编译中pod报错CocoaPods could not find compatible versions for pod "XXXXX":

pod install no repo update Analyzing dependencies CocoaPods could not find compatible versions for pod XXXXX In snapshot
本征正交分解（POD）入门（详解）

思来想去还是把题目从简介改成了入门详解其实详解主要就是针对可能没接触过矩阵论的同学我也是研一才学的入门是指的我会解释一些名词方便理解另外PCA 主成分分析本质上就是POD 只是我最近翻的热工学论文大部分都用的POD这个名
将 powershell 命令的输出保存在变量中并在批处理脚本中使用它？

我想做的是保存 powershell 命令的输出从批处理脚本运行并在批处理脚本中使用它你能告诉我该怎么做吗 powershell命令是 System Net Dns GetHostByName hostname HostName 我想
为什么 kubernetes 需要有 2 个 coredns pod

我安装了新的 kubernetes 单节点集群并且看到 2 个 coredns pod 正在运行其中一个失败了不是这个问题的一部分为什么他们是2个有关 CoreDNS 的详细调整信息link CoreDNS 内存使用情况主要受集群
dig：加载共享库时出错：libdns.so.162：无法打开共享对象文件：没有这样的文件或目录

您好我在我的服务器上我尝试启用 https 但出现此错误 dig error while loading shared libraries libdns so 162 cannot open shared object file No
如何进入 CoreDNS pod kubernetes？

我有一个正在运行的 k8s 集群其中包含两个 CoreDNS 副本但是当我尝试输入 POD 的 bash 提示符时它向我抛出以下错误 kubectl exec it coredns 5644d7b6d9 285bj n kube sy
如何更改默认的WCF服务绑定？

在我的 WCF 中我有一些服务其中之一必须对消息大小有更大的限制因此我必须创建另一个绑定并更改配置但是我在 Web config 中看不到我的服务的任何配置什么也没有有什么是默认的吗那么我可以在哪里更改服务绑定呢在 WCF
PHP邮件、DNS请求超时、FQDN

我要实现mail 我的 PHP 工作Windows Server 2012 R2 为此我首先安装了SMTP依照指示这一页 http www vsysad com 2014 09 setup and configure smtp serve
完全合格的域名是否需要句点？

我对 FQDN 完全合格域名感到困惑 FQDN 是否需要以句点结尾喜欢sun or sun tuc noao edu or sun tuc noao edu 有什么不同 IT 的工作原理域名系统 https technet micr
如何将我自己的存储库分叉到新项目中？

我正在开发一个 HTML5 游戏引擎我使用 Git 作为 SV 并使用 GitHub 来实际托管该项目我在设计上做了一些实质性的改变主要是切换到实体系统范例我认为是时候换一个新引擎了我想将它建立在旧引擎的基础上因为我可以使用很多

随机推荐

Ubuntu设置静态IP

安装Ubuntu后有时候IP会变化导致远程连接不上 xff0c 网上很多都是命令行操作的或者改相应的文件 xff0c 如果能在界面上操作更简单了右上角 Setting gt Network
Qt qml 输出行号 __LINE__ LINENO等信息

使用 Qt Creator xff0c 按下面的路径可以设置 xff08 Ubuntu Window即可这样设置 xff09 xff1a QT MESSAGE PATTERN file line message 在windows下还可以通过
QT5.15.2 View3D 在Ubuntu上无法运行的解决办法

QT 5 15 2 View3D 在Ubuntu20 04上运行的时候发现无法显示3D模型 xff0c 并报错经反复折腾发现需要设置 MESA GL VERSION OVERRIDE 61 3 10 xff0c 具体为什么是3 10目前不
IMX6ULL + SPI LCD（驱动IC ILI9341）显示简单的QT界面

1 硬件 xff1a 使用正点原子的IMX6ULL Linux开发板开发板底板原理图版本 xff1a V2 1 核心板原理图版本 xff1a V1 6 LCD xff1a MSP2402 IC ILI9341 2 查找可用引脚开发板上引
Cmakelist知识总结

Cmakelist知识总结文章目录 Cmakelist知识总结程序编译链接过程简介Cmakelist简介Cmakelist写法cmakelist实例解析程序编译链接过程简介一个完整的 C 43 43 语言项目可能包含多个 cpp 源文
四个好看的CSS样式表格

1 单像素边框CSS表格这是一个很常用的表格样式源代码 xff1a lt CSS goes in the document HEAD or added to your external stylesheet gt lt style ty
举轻若重，于无声处听惊雷，微软大师级人物展示平平无奇的伟大算法

近日微软神级人物 Raymond Chen最近在个人博客上 xff0c 发布了一篇关于如何计算平均值的博文这个话题虽然看似平淡无奇 xff0c 却意外在引爆 xff0c 并带来无数讨论 xff1a 看完这篇博客之
11代Intel安装Ubuntu 18.04遇到问题及解决方案汇总

因为开发工作需要 xff0c 要在电脑上安装Ubuntu 18 04系统由于机型较新 xff0c 在安装系统后出现了一系列问题 xff0c 如显卡驱动黑屏无WIFI适配器无声音等以下是具体问题及解决方案 xff0c 均亲测有效机型
Linux中mysql5.7修改character_ set_ database为utf8

起因 xff1a 使用mysql xff0c 在表中插入中文字符的时候报错原因是表的charset是latin1 xff0c 不支持中文将charset改成utf8就可以插入中文字符他默认建表的时候使用的编码是latin1 xff0c
【面试题】简述Linux启动过程

Centos6启动过程 xff1a 在rc3 d目录中 xff0c 以S开头的文件为执行该服务 xff0c 以K开头的文件则是杀掉该服务的意思数字代表启动顺序 Centos6 启动流程图 xff1a Centos7启动过程 xff1a c
dockerfile使用copy报错stat /var/lib/docker/tmp xxxxxxxx No such file or directory

使用dockerfile的copy报错 xff0c stat var lib docker tmp xxxxxxxx No such file or directory 我使用绝对路径来拷贝文件 xff0c 之后提示报错不存在该文件解决
Linux运维简历模板&技术储备（by ob）

总结学过的知识点 xff1a Linux启动过程 xff0c NFS原理 xff0c RSYNC xff0c LVS模式原理 xff0c MYSOL主从同步原理 xff0c 及故障了如何解决还有备份恢复的方案监控报警等 Linux基础指
一台grafana监控多台Windows server的操作配置

一台grafana监控多台Windows server的操作配置首先要将一台服务器搭建好prometheus 43 grafana 具体参考 xff1a https blog csdn net qq 38661798 article de
VMware仅主机模式，DHCP无法获取Ip ，No DHCPOFFERS received处理方法

环境 xff1a VMware 14 xff0c centos 7 公司电脑的桥接模式 xff0c NAT模式 xff0c 仅主机模式都正常家里面笔记本仅主机模式通过DHCP无法获取到IP 连接仅主机模式的网卡ens36配置 ifcfg
Linux中查看进程信息的指令小结（ps 、ss、netstat、lsof 、pwdx、prtstat、ls -al /proc/[pid] ）

Linux中查看进程信息的指令小结 xff1a 一 ps report a snapshot of the current processes 报告当前进程的快照 ps aux grep java 下图中的 61410 xff0c 1193
处理 mkdir：无法创建目录“aaa“：只读文件系统

问题如图 xff1a df h cat etc fstab 问题描述 mkdir cannot create directory 96 test 39 Read only span class token function file spa
更换tomcat版本，java.lang.IllegalStateException 启动子级时出错

一问题背景 tomcat版本从 0 31更换到0 52 更换tomcat碰到的坑 java lang IllegalStateException 启动子级时出错二问题源头问题源头是环境变量问题 jdk版本不对系统初始化时有个自带的
从M1、Grace再到华为，缝合风为何会在芯片大厂中流行

历史不会简单重复 xff0c 但总是惊人的相似之前在电影游戏等人文领域流行的缝合风 xff0c 似乎也对IT界芯片设计师们产生了影响 xff0c 虽然去年华为提出的双芯叠加方案还被全网群嘲 xff0c 而上周英伟达最新的发布会上 xff
田忌赛马 - 去哪儿2018校招哈尔滨在线笔试题 - 开发工程师

时间限制 xff1a C C 43 43 语言 1000MS xff1b 其他语言 3000MS 内存限制 xff1a C C 43 43 语言 65536KB xff1b 其他语言 589824KB 题目描述 xff1a 田忌和齐王赛马
【故障排查】dig通过coredns的svc IP，解析pod的fqdn出现connection timed out； no servers could be reached

环境信息 xff1a span class token comment 另一个环境 span master1 master2 node1 node2 k8s span class token number 1 22 span span cl

热门标签