K8s Pod 意外重启排查三板斧

现象

Pod 状态正常，但重启次数不断增加，业务偶发异常。

kubectl describe pod <pod-name> | grep "Exit Code"

kubectl top pod <pod-name>
kubectl describe pod <pod-name> | grep -A 5 -B 5 "Limits\|Requests"

内存使用接近 limit？调大或优化代码。

# 在节点上执行
dmesg | grep -i "killed process"
journalctl -u kubelet | grep OOM

退出码	可能原因	解决方案
137	OOM Killer	增加内存限制或优化内存使用
143	优雅关闭超时	增加 terminationGracePeriodSeconds
1	应用 Bug	查看应用日志，修复代码问题
0	正常退出但重启	检查 restartPolicy 和健康检查

记住：90% 的 Pod 重启问题都是资源不足或应用 Bug。