问题1:K8S集群服务访问失败?
![在这里插入图片描述](https://img-blog.csdnimg.cn/7aafe218342d4557810c9fa5f0a36359.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxXzQwOTA3OTc3,size_16,color_FFFFFF,t_70)
原因分析:证书不能被识别,其原因为:自定义证书,过期等。
解决方法:更新证书即可。
问题2:K8S集群服务访问失败?
curl: (7) Failed connect to 10.103.22.158:3000; Connection refused
原因分析:端口映射错误,服务正常工作,但不能提供服务。
解决方法:删除svc,重新映射端口即可。
kubectl delete svc nginx-deployment
问题3:K8S集群服务暴露失败?
Error from server (AlreadyExists): services "nginx-deployment" already exists
原因分析:该容器已暴露服务了。
解决方法:删除svc,重新映射端口即可。
问题4:外网无法访问K8S集群提供的服务?
原因分析:K8S集群的type为ClusterIP,未将服务暴露至外网。
解决方法:修改K8S集群的type为NodePort即可,于是可通过所有K8S集群节点访问服务。
kubectl edit svc nginx-deployment
问题5:pod状态为ErrImagePull?
readiness-httpget-pod 0/1 ErrImagePull 0 10s
![在这里插入图片描述](https://img-blog.csdnimg.cn/d473def88514455dab59c7fa04abb41e.png)
原因分析:image无法拉取;
![在这里插入图片描述](https://img-blog.csdnimg.cn/0084f8b8d7854d1b80d38271ff3ccb4f.png)
![在这里插入图片描述](https://img-blog.csdnimg.cn/b4d9d17479f54c5dac5006d17a9f0bca.png)
解决方法:更换镜像即可。
问题6:创建init C容器后,其状态不正常?
NAME READY STATUS RESTARTS AGE
myapp-pod 0/1 Init:0/2 0 20s
原因分析:查看日志发现,pod一直出于初始化中;然后查看pod详细信息,定位pod创建失败的原因为:初始化容器未执行完毕。
Error from server (BadRequest): container "myapp-container" in pod "myapp-pod" is waiting to start: PodInitializing
![在这里插入图片描述](https://img-blog.csdnimg.cn/d96626c2858d42d7b1bc987070f33f4f.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxXzQwOTA3OTc3,size_16,color_FFFFFF,t_70)
![在这里插入图片描述](https://img-blog.csdnimg.cn/e3abba7def884d1fb938e9ebb26cf3aa.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxXzQwOTA3OTc3,size_16,color_FFFFFF,t_70)
![在这里插入图片描述](https://img-blog.csdnimg.cn/42ed16ae17c54e4fae883bffc1b1bfbf.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxXzQwOTA3OTc3,size_16,color_FFFFFF,t_70)
waiting for myservice
Server: 10.96.0.10
Address: 10.96.0.10:53
** server can't find myservice.default.svc.cluster.local: NXDOMAIN
*** Can't find myservice.svc.cluster.local: No answer
*** Can't find myservice.cluster.local: No answer
*** Can't find myservice.default.svc.cluster.local: No answer
*** Can't find myservice.svc.cluster.local: No answer
*** Can't find myservice.cluster.local: No answer
方法:创建相关service,将SVC的name写入K8S集群的coreDNS服务器中,于是coreDNS就能对POD的initC容器执行过程中的域名解析了。
kubectl apply -f myservice.yaml
![在这里插入图片描述](https://img-blog.csdnimg.cn/967ff93a399d493baea783a6fde665d7.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxXzQwOTA3OTc3,size_16,color_FFFFFF,t_70)
NAME READY STATUS RESTARTS AGE
myapp-pod 0/1 Init:1/2 0 27m
myapp-pod 0/1 PodInitializing 0 28m
myapp-pod 1/1 Running 0 28m
![在这里插入图片描述](https://img-blog.csdnimg.cn/d7fd2df85a0740018fd3b8e2fdfcc992.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxXzQwOTA3OTc3,size_16,color_FFFFFF,t_70)
问题7:探测存活pod状态为CrashLoopBackOff?
原因分析:镜像问题,导致容器重启失败。
解决方法:更换镜像即可。
# 问题8:POD创建失败?
readiness-httpget-pod 0/1 Pending 0 0s
readiness-httpget-pod 0/1 Pending 0 0s
readiness-httpget-pod 0/1 ContainerCreating 0 0s
readiness-httpget-pod 0/1 Error 0 2s
readiness-httpget-pod 0/1 Error 1 3s
readiness-httpget-pod 0/1 CrashLoopBackOff 1 4s
readiness-httpget-pod 0/1 Error 2 15s
readiness-httpget-pod 0/1 CrashLoopBackOff 2 26s
readiness-httpget-pod 0/1 Error 3 37s
readiness-httpget-pod 0/1 CrashLoopBackOff 3 52s
readiness-httpget-pod 0/1 Error 4 82s
原因分析:镜像问题导致容器无法启动。
![在这里插入图片描述](https://img-blog.csdnimg.cn/4f8545733a0840b78c783d9c87b4cbc4.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxXzQwOTA3OTc3,size_16,color_FFFFFF,t_70)
解决方法:更换镜像。
![在这里插入图片描述](https://img-blog.csdnimg.cn/4a8fd375935942c5abd0f1f1c24d8a46.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxXzQwOTA3OTc3,size_16,color_FFFFFF,t_70)
![在这里插入图片描述](https://img-blog.csdnimg.cn/f643f27818d34307966d895785c7cae4.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxXzQwOTA3OTc3,size_16,color_FFFFFF,t_70)
问题9:POD的ready状态未进入?
readiness-httpget-pod 0/1 Running 0 116s
原因分析:POD的执行命令失败,无法获取资源。
![在这里插入图片描述](https://img-blog.csdnimg.cn/3099c8ac47b845eba7efab1d676b31f0.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxXzQwOTA3OTc3,size_16,color_FFFFFF,t_70)
解决方法:进入容器内部,创建yaml定义的资源
![在这里插入图片描述](https://img-blog.csdnimg.cn/3cd55bb9dd7f44d9bbe44c810c3fdba9.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxXzQwOTA3OTc3,size_16,color_FFFFFF,t_70)
问题10:pod创建失败?
![在这里插入图片描述](https://img-blog.csdnimg.cn/63540ed0bfdd41b0b96185ec8b957f4c.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxXzQwOTA3OTc3,size_16,color_FFFFFF,t_70)
原因分析:yml文件内容出错—-使用中文字符;
解决方法:修改myregistrykey内容即可。
![在这里插入图片描述](https://img-blog.csdnimg.cn/dd53d6487c89460497821e6975a71ca1.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxXzQwOTA3OTc3,size_16,color_FFFFFF,t_70)
11、kube-flannel-ds-amd64-ndsf7插件pod的status为Init:0/1?
![在这里插入图片描述](https://img-blog.csdnimg.cn/57c96fb8b8e44a1c80ddf0f2ad3999d5.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxXzQwOTA3OTc3,size_16,color_FFFFFF,t_70)
原因分析:k8s-slave1节点拉取镜像失败。
解决方法:登录k8s-slave1,重启docker服务,手动拉取镜像。
![在这里插入图片描述](https://img-blog.csdnimg.cn/0f96dbd4ed0b40578f8b6af5b2ca3a86.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxXzQwOTA3OTc3,size_16,color_FFFFFF,t_70)
k8s-master节点,重新安装插件即可。
kubectl create -f kube-flannel.yml;kubectl get nodes
![在这里插入图片描述](https://img-blog.csdnimg.cn/91345bfd2cf84174abb200ccc0a6c7cd.png)
12、K8S创建服务status为ErrImagePull?
![在这里插入图片描述](https://img-blog.csdnimg.cn/d7f6d9d66b224152b4d30117ad8a26e7.png)
排查思路:
kubectl describe pod test-nginx
![在这里插入图片描述](https://img-blog.csdnimg.cn/983902e1c40d4bbd9fc0a4d75abfb647.png)
原因分析:拉取镜像名称问题。
解决方法:删除错误pod;重新拉取镜像;
kubectl delete pod test-nginx;kubectl run test-nginx --image=10.0.0.81:5000/nginx:alpine
13、不能进入指定容器内部?
![在这里插入图片描述](https://img-blog.csdnimg.cn/0c90ff8cac3c4512a4e0c3595acf54dd.png)
原因分析:yml文件comtainers字段重复,导致该pod没有该容器。
解决方法:去掉yml文件中多余的containers字段,重新生成pod。
![在这里插入图片描述](https://img-blog.csdnimg.cn/6daa5850dddc4e31a4a3a96f7cc8041e.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxXzQwOTA3OTc3,size_16,color_FFFFFF,t_70)
14、创建PV失败?
![在这里插入图片描述](https://img-blog.csdnimg.cn/45a6aee47bd04d118187300c17659b01.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxXzQwOTA3OTc3,size_16,color_FFFFFF,t_70)
原因分析:pv的name字段重复。
解决方法:修改pv的name字段即可。
![在这里插入图片描述](https://img-blog.csdnimg.cn/8b58cde8cd1b46848e01f1cf6e76e32c.png)
15.pod无法挂载PVC?
![在这里插入图片描述](https://img-blog.csdnimg.cn/8cd94dd346714d7ebe7cabeba2cbb880.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxXzQwOTA3OTc3,size_16,color_FFFFFF,t_70)
原因分析:pod无法挂载PVC。
![在这里插入图片描述](https://img-blog.csdnimg.cn/09b86c9a13894f57b2c6929cd9aa2507.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxXzQwOTA3OTc3,size_16,color_FFFFFF,t_70)
accessModes与可使用的PV不一致,导致无法挂载PVC,由于只能挂载大于1G且accessModes为RWO的PV,故只能成功创建1个pod,第2个pod一致pending,按序创建时则第3个pod一直未被创建;
解决方法:修改yml文件中accessModes或PV的accessModes即可。
![在这里插入图片描述](https://img-blog.csdnimg.cn/1d454213dc904a6c9812a95d36ffe211.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxXzQwOTA3OTc3,size_16,color_FFFFFF,t_70)
16、问题:pod使用PV后,无法访问其内容?
![在这里插入图片描述](https://img-blog.csdnimg.cn/93a555e0cb0f470d819c32caa185b07b.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxXzQwOTA3OTc3,size_16,color_FFFFFF,t_70)
原因分析:nfs卷中没有文件或权限不对。
![在这里插入图片描述](https://img-blog.csdnimg.cn/563472aa438044a9bc2646aa0f965369.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxXzQwOTA3OTc3,size_16,color_FFFFFF,t_70)
解决方法:在nfs卷中创建文件并授予权限。
![在这里插入图片描述](https://img-blog.csdnimg.cn/bb56a9dca26647bd87bbd7b2c07d5879.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxXzQwOTA3OTc3,size_16,color_FFFFFF,t_70)
17、查看节点状态失败?
Error from server (NotFound): the server could not find the requested resource (get services http:heapster:)
原因分析:没有heapster服务。
解决方法:安装promethus监控组件即可。
![在这里插入图片描述](https://img-blog.csdnimg.cn/ba25bcd3234443d5b98ada692b9be461.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxXzQwOTA3OTc3,size_16,color_FFFFFF,t_70)
18、pod一直处于pending’状态?
![在这里插入图片描述](https://img-blog.csdnimg.cn/69663d6045f7430cb8903d48cd22e676.png)
原因分析:由于已使用同样镜像发布了pod,导致无节点可调度。
解决方法:删除所有pod后部署pod即可。
![在这里插入图片描述](https://img-blog.csdnimg.cn/f6c6672685464ae682fdab34a390c24a.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxXzQwOTA3OTc3,size_16,color_FFFFFF,t_70)
19、helm安装组件失败?
[root@k8s-master01 hello-world]# helm install
Error: This command needs 1 argument: chart nam
[root@k8s-master01 hello-world]# helm install ./
Error: no Chart.yaml exists in directory "/root/hello-world"
原因分析:文件名格式不对。
解决方法:mv chart.yaml Chart.yaml
![在这里插入图片描述](https://img-blog.csdnimg.cn/c8fe2dc6b0164e64a6d4443231cfc50b.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxXzQwOTA3OTc3,size_16,color_FFFFFF,t_70)
参考链接 :
https://mp.weixin.qq.com/s/CXmw4pagtA2D4soNu3dejg
19 个 K8S 日常故障处理集锦!
源:https://www.cnblogs.com/chalon/p/14415252.html