排查Kubernetes中Pod/Container崩溃的根本原因,可通过以下步骤:1. 使用kubectl describe pod <pod-name>
查看Pod事件,检查OOM、镜像拉取失败等错误;2. 通过kubectl logs <pod-name> --previous
获取崩溃前日志;3. 使用kubectl exec
进入容器检查运行时状态;4. 检查资源限制是否过小导致OOM。
延伸知识点:Kubernetes探针机制(Liveness/Readiness Probe)配置错误是常见崩溃原因。存活探针(Liveness Probe)用于检测应用是否处于死锁状态,当连续探测失败次数超过failureThreshold
时,kubelet会重启容器。例如,若配置HTTP探针指向错误端口,会导致容器被误重启。正确配置应确保:1. 探测端点与容器实际监听端口一致;2. initialDelaySeconds
需大于应用启动时间;3. periodSeconds
不宜过短(默认10秒),避免高频探测引发意外重启。