简单回答:排查Kubernetes集群高延迟需检查节点网络、CNI插件、Service负载均衡、Pod资源限制及DNS解析。
延伸知识点:Service的负载均衡机制(IPVS vs iptables) Kubernetes Service通过kube-proxy实现负载均衡,默认使用iptables模式。当Service数量超过1,000时,iptables的线性规则匹配会导致延迟升高。此时应切换为IPVS模式:
- IPVS基于内核哈希表,支持负载均衡算法(rr/wrr/lc等)
- 修改kube-proxy配置: --proxy-mode=ipvs --ipvs-scheduler=rr (轮询)
- 需确保节点加载ip_vs内核模块: lsmod | grep ip_vs
- 性能对比:
- 10,000个Service时,IPVS创建规则速度比iptables快36%
- 并发请求处理能力提升2倍 切换后需监控延迟指标,结合EndpointSlices特性优化大规模服务发现。