kubernetes集群删除pod后长时间处于Terminating状态的案例

JustHaveTry 2020-07-17

背景：

预生产环境，使用kubeadm部署的HA集群如下。

NAME STATUS ROLES AGE VERSION
sbfk1test Ready master 37d v1.15.2
sbfk2test Ready master 37d v1.15.2
sbfk3test Ready <none> 37d v1.15.2

现象：

删除pod后，长时间处于Terminating状态，几分钟到十几分钟不等。

使用kubectl delete pod --force --grace-period=0 <PODNAME>来强制删除。

定位：

1、Terminating慢的定位，看了很多文档，都没有头绪。在网上看到一个疑似的案例，资源使用率较高，导致kubectl在销毁资源的时候被stuck。

2、查看两台宿主机的资源使用，总体资源比较空闲，但是看到etcd的进程cpu大于50%。

推测可能跟etcd的性能或者集群配置更新有关系，于是查看etcd的pod的日志，看到sbfk2test的etcd一直在刷：error "tls: \"<IP地址A>\" does not match any of DNSNames [\"sbfk1test\" \"localhost\"]

这时我想到自己制作证书的时候，地址写了IP地址A，而etcd是启用了双向认证的，sbfk1test请求sbfk2test的etcd-api时报错client证书问题。

到这里，我就知道自己配置etcd集群的证书是有问题的。

验证：

修改/etc/kubernetes/manifests/etcd.yaml的：

--client-cert-auth=true 改为 --client-cert-auth=false

--peer-client-cert-auth=true 改为 --peer-client-cert-auth=false

把client的认证改为false，发现两个master的etcd的pod都不报错了，查看进程消耗，发现etcd的cpu使用率小于5%。

解决：

制作新的etcd证书，且该证书支持多域名或ip地址，把kube-apiserver地址、etcd的主机名都加进去。

: JustHaveTry

相关推荐

两款超好用的Kubernetes实时日志查看工具

通常情况下，Kubernetes 环境下的应用日志都需要通过日志系统来进行收集，比如：Filebeat + ElasticSearch + Kibana 的组合来实现。虽然这一组合的功能相当强大，但是在一些比较简陋的测试集群中，或者不具备浏览器条件的自动化

远远的山 0喜欢 / 12评论 2020-11-09

Kubernetes上对应用程序进行故障排除的6个技巧

从 Docker 迁移到 Docker Swarm，再到 Kubernetes，然后处理了多年来的所有各种 API 更改之后，我非常乐意发现部署中出现的问题和把问题进行修复。我今天分享下我认为最有用的5条故障排除技巧，以及一些其他的使用技巧。这个命令如此重

kaidiphp 0喜欢 / 10评论 2020-10-13

首次部署 Kubernetes 应用，总会忽略这些事

根据我的个人经验，大多数人似乎倾向于通过 Helm 或者手动方式将应用程序甩给 Kubernetes，之后就坐等每天轻松调用的美好生活。但在 GumGum 公司的实践当中，我们体会到 Kubernetes 应用的一系列“陷阱”，也希望把这些陷阱与大家分享，

JustHaveTry 0喜欢 / 0评论 2020-09-29

Kubernetes如何为应用程序提供网络和存储？

网络组件支持pod到pod、节点到pod、pod到服务以及外部客户端到服务的通信。Kubernetes遵循用于实现网络服务的插件模式。Kubenet是默认的网络插件，配置简单。它通常与为节点之间或单节点环境中的通信设置路由规则的云提供商一起使用。Kuber

cloudvtech 0喜欢 / 0评论 2020-09-18

一个小需求，自动重启k8s集群中日志不刷新的POD

日常工作中，所有项目都不是完美的，笔者就经常遇到这种情况，pod状态是running，但是程序却没有响应。发生这种情况的原因有很多种，有可能是因为k8s健康检查的原因，比如使用ps检查进程;或者是程序内部死循环，但是不退出;再或者网络闪断，程序无法重连等等

XiaoMuFireAnt 0喜欢 / 0评论 2020-09-02

第7章：Kubernetes存储

创建一个空卷，挂载到Pod中的容器。Pod删除该卷也会被删除。什么样的适合在pod中运行多个容器?command: ["bash","-c","for i in {1..100};do echo $i &g

BigDataMining 0喜欢 / 0评论 2020-08-21

18、Secret

Secret 解决了密码、token、密钥等敏感数据的配置问题，而不需要把这些敏感数据暴露到镜像或者 Pod Spec中。Secret 可以以 Volume 或者环境变量的方式使用。Opaque：base64编码格式的Secret，用来存储密码、密钥等。使

IT兄弟团 0喜欢 / 0评论 2020-08-01

深入掌握K8S Pod

Pod是k8s中最小的调度单元，包含了一个“根容器”和其它用户业务容器。如果你使用过k8s的话，当然会了解pod的基本使用，但是为了更好的应用，你需要深入了解pod的配置、调度、升级和扩缩容等。本文将会更进一步的介绍pod。pod包含一个或多个相对紧密耦合

akcsdno 0喜欢 / 0评论 2020-07-21

React Native pod install错误 SDK \"iphoneos\" cannot be located

给Xcode命令行工具指定路径。//查看所有可用sdk

孝平 0喜欢 / 0评论 2020-07-18

Kubernetes-12：Secret介绍及演示

　　Secret解决了密码、token、密钥等敏感数据的配置问题，而不需要把这些敏感数据暴露到镜像或者Pod Spec中，可以以Volume或者环境变量的方式使用。　　Opaque：base64编码格式的Secret，用来存储密码、秘钥等。只要与Kuber

kjh00abc 0喜欢 / 0评论 2020-07-08

Kubernetes之POD、容器之间的网络通信

Kubernetes是开源的容器集群管理系统，可以实现容器集群的自动化部署、自动扩缩容、维护等功能。它既是一款容器编排工具，也是全新的基于容器技术的分布式架构领先方案。在Docker技术的基础上，为容器化的应用提供部署运行、资源调度、服务发现和动态伸缩等功

Dxiaoru 0喜欢 / 0评论 2020-07-06

从零开始了解 Kubernetes

Kubernetes 已经成为容器编排领域的王者，它是基于容器的集群编排引擎，具备扩展集群、滚动升级回滚、弹性伸缩、自动治愈、服务发现等多种特性能力。本文将带着大家快速了解 Kubernetes ，了解我们谈论 Kubernetes 都是在谈论什么。从宏

breezegao 0喜欢 / 0评论 2020-07-02

kubernetes(六) 基于kubeadm构建高可用k8s集群

k8s如果向替换CRI的话，只需要讲POD使用相关的容器技术封装即可。service：实现了从宿主机外层访问k8s内部不同的容器的访问方式，还实现了pod的动态发现；因此可以说Service是k8s内部的负载均衡器。作为集群内部的控制中心，负责集群内部的

xiunai 0喜欢 / 0评论 2020-06-28

Kubernetes（k8s）的RC(Replication Controller)副本控制器

　　应用托管在kubernetes之后，kubernetes需要保证应用能够持续运行，这是RC的工作内容，它会确保任何时间kubernetes中都有指定数量的Pod在运行。RC除了保证Pod高可用之外，还提供了更高级的特性，比如滚动升级，升级回滚等等。

薛正华 0喜欢 / 0评论 2020-06-21

Kubernetes（k8s）的Service资源

答：运行在docker中的业务，想要被外界访问，我们需要为它做端口映射才能被访问，那么运行在k8s中的容器，为什么不能直接为它做端口映射呢？在K8s中Node端口映射不可以直接映射到我们的Pod的Ip地址上面，此时K8s引入了Service,VIP地址段的

JustHaveTry 0喜欢 / 0评论 2020-06-21

Kubernetes 0-1 Pod中的livenessProbe和readinessProbe解读

K8S对Pod的健康状态可以通过两类探针来检查：livenessProbe和readinessProbe，kubelet通过定期执行这两类探针来诊断容器的健康状况。存活指针，判断Pod是否健康，可以理解为健康检查。当我们执行kubectl get pods

丽丽 0喜欢 / 0评论 2020-06-14

Kubernetes:深入了解Deployment

kuberntes部署应用最常用的一个控制器，Deployment可以部署无状态应用，像web、api就是无状态应用。pod对象作为一个最小的调度单元，很少直接创建，一般使用控制器来完成一个应用的部署，控制器在集群上管理和运行容器的对象，这个对象是高级的，

shurenyun 0喜欢 / 0评论 2020-06-14

kubernetes入门到实战（八）Pod健康检查机制

应用在运行过程中难免会出现错误，如程序异常，软件异常，硬件故障，网络故障等，kubernetes提供Health Check健康检查机制，当发现应用异常时会自动重启容器，将应用从service服务中剔除，保障应用的高可用性。readiness probes

JustHaveTry 0喜欢 / 0评论 2020-06-12

简单5步，轻松debug K8S服务！

在Kubernetes中，服务是一个核心概念。在本文中，将介绍如何调试K8S服务，这些服务是由多个Pod组成的工作负载的抽象接口。在我们深入探索debug方法之前，我们先简单回顾一下网络，这是Kubernetes服务的基础。在一个pod中的容器共享相同的网

xingyuzhe 0喜欢 / 0评论 2020-06-10

Pod和容器的生命周期管理

Pod由一组应用容器组成，其中包含共有的环境和资源约束。在 CRI里，这个环境被称为PodSandbox。Kubernetes有意为容器运行时留下一些发挥空间，它们可以根据自己的内部实现来解释PodSandbox。对于Hypervisor类的运行时，P

lantingyue 0喜欢 / 0评论 2020-06-10

k8s，spring cloud gateway,nginx搭建随笔

最近完成了基于k8s的springcloud搭建，记录下过程。Service是Pod提供的服务的抽象,因为K8S的Pod的容器是不稳定的,可能会挂掉,这种情况下，K8S就会为我们重新启动POD，维持着指定的状态。Deployment控制RS，RS控制Pod

hyxinyu 0喜欢 / 0评论 2020-06-10

k8s之标签选择器

undefinedLabel(标签)是Kubernetes系统中另外一个核心概念。一个Label是一个key=value的键值对，其中key与value由用户自己指定。Label可以被附加到各种资源对象上，例如Node、Pod、Service、RC等，

xingyuzhe 0喜欢 / 0评论 2020-06-09

k8s之pods

Label(标签)是Kubernetes系统中另外一个核心概念。一个Label是一个key=value的键值对，其中key与value由用户自己指定。Label可以被附加到各种资源对象上，例如Node、Pod、Service、RC等，一个资源对象可以

wishli 0喜欢 / 0评论 2020-06-08

k8s之pod

Pod是Kubernetes最重要的基本概念，如图1.4所示是Pod的组成示意图，我们看到每个Pod都有一个特殊的被称为“根容器”的Pause容器。Pause容器对应的镜像属于Kubernetes平台的一部分，除了Pause容器，每个Pod还包含一个或

JayFighting 0喜欢 / 0评论 2020-06-08

了解容器编排的构建块，可以使Kubernetes入门更加容易

容器编排是指用于自动化，管理和调度由各个容器定义的工作负载的工具和平台。每种技术都有其优缺点，但是Kubernetes的日益普及和社区的强大支持已经清楚地表明，Kubernetes目前是容器编排当之无愧的领导者了。在使用开源软件时，Kubernetes具有

aoxixi 0喜欢 / 0评论 2020-06-08

kubernetes入门到实战（七）资源管理和Qos

容器运行过程中需要分配所需的资源，如何与cggroup联动配合呢？答案是通过定义resource来实现资源的分配，资源的分配单位主要是cpu和memory，资源的定义分两种：requests和limits，requests表示请求资源，主要用于初始kube

guan000 0喜欢 / 0评论 2020-06-08

k8s资源需求和限制, 以及pod驱逐策略

如果Pod中所有Container的所有Resource的limit和request都相等且不为0，则这个Pod的QoS Class就是Guaranteed。注意，如果一个容器只指明了limit，而未指明request，则表明request的值等于limi

guan000 0喜欢 / 0评论 2020-06-05

kubernetes系列 - kubectl的入门操作

docker本身设置镜像加速。以下操作如果失败，开启ssr的全局模式进行再次操作。Minikube - Kubernetes本地实验环境。# 清理minikube本地状态。这一句之后，kubectl还会被配置为默认使用minikube！！pod运行在一个私

xingyuzhe 0喜欢 / 0评论 2020-06-05

使用Kubernetes的四个理由

大多数现代软件开发人员可以证明，容器为我们提供了更大的灵活性，可以在物理和虚拟基础架构上运行云原生应用程序。容器将组成应用程序的服务打包，并使其可在不同的计算环境中移植，以供开发/测试和生产使用。使用容器，可以轻松地快速扩展应用程序实例以适应需求的高峰。这

岳飞 0喜欢 / 0评论 2020-06-04

举例：Network Policies

本文描述了如何在 Kubernetes 集群中通过创建 NetworkPolicy 的方式来声明网络策略，以管理 Pod 之间的网络通信流量。您已经安装了 Kubernetes 集群，如果没有，请参考文档安装Kubernetes单Master节点。按字母

zccheu 0喜欢 / 0评论 2020-06-04

解决Kubernetes Pod故障的5个简单技巧

在很多情况下，你可能会发现Kubernetes中的应用程序没有正确地部署，或者没有正常地工作。今天这篇文章就提供了如何去快速解决这类故障以及一些技巧。在阅读了这篇文章之后，你还将深入了解Kubernetes的内部机制，另外，我还将与大家分享一些关于自己操作

limx 0喜欢 / 0评论 2020-06-04

更新应用时，如何实现 K8s 零中断滚动更新？

即可下载电子书>. 《深入浅出 Kubernetes》一书共汇集 12 篇技术文章，帮助你一次搞懂 6 个核心原理，吃透基础理论，一次学会 6 个典型问题的华丽操作！集群中，业务通常采用?这种架构部署和运维都十分简单方便，但是在应用更新或者升级时可能

wishli 0喜欢 / 0评论 2020-06-03

k8s学习-集群调度

Scheduler 是 kubernetes 的调度器，主要的任务是把定义的 pod 分配到集群的节点上。听起来非常简单，但有很多要考虑的问题：。Sheduler 是作为单独的程序运行的，启动之后会一直持续链接API Server，获取PodSpec.No

kjh00abc 0喜欢 / 0评论 2020-05-31

k8s学习-Ingress

通常情况下，Service 和 Pod 的 IP 仅可在集群内部访问。集群外部的请求需要通过负载均衡转发到 Service 在 Node 上暴露的 NodePort 上，然后再由 kube-proxy 通过边缘路由器将其转发给相关的 Pod 或者丢弃。

competeking 0喜欢 / 0评论 2020-05-31

k8s学习-pod生命周期

更改Init容器的image字段，等价于重启该Pod。这会在验证中强制性检查。

somyjun 0喜欢 / 0评论 2020-05-31

kubernetes系列之 service代理模式ipvs

节点： 172.16.20.120 , 集群网络： 10.244.5.0/24 , cni0: 10.244.5.1/24 ，flannel.1: 10.244.5.0/32. Service是由kube-proxy组件实现，而kube-proxy支持多种

薛正华 0喜欢 / 0评论 2020-05-30

Review：人人都能看懂 Pod 与容器设计模式

Pod 里的多个容器怎么去共享网络？Infra container 是一个非常小的镜像，大概 100~200KB 左右，是一个汇编语言写的、永远处于“暂停”状态的容器。由于有了这样一个 Infra container 之后，其他所有容器都会通过 Join

容数据服务集结号 0喜欢 / 0评论 2020-05-29

一篇文章为你图解Kubernetes对象模型

Kubernetes的对象模型是K8s又一精巧的设计。我们知道，K8s所建立的容器化生态是复杂且多变的，而对象模型就是将一系列的资源实体抽象成K8s中所能识别的对象。为了方便大家更全面的了解K8s的设计思想，本文对K8s的对象模型进行了梳理，同时在文章末尾

yevvzi 0喜欢 / 0评论 2020-05-29

基于 kubeadm 搭建高可用的kubernetes 1.18.2 (k8s)集群三集群可用性测试

# 检查各 Node 上的 Pod IP 连通性。# 在每个节点上访问服务。# 在每个节点检查node-port可用性。# 进入pod，查看dns. $ kubectl exec nginx -i -t -- /bin/bash. # 查看名字是否可以正

咻咻ing 0喜欢 / 0评论 2020-05-28

一篇文章为你图解Kubernetes对象模型

Kubernetes的对象模型是K8s又一精巧的设计。我们知道，K8s所建立的容器化生态是复杂且多变的，而对象模型就是将一系列的资源实体抽象成K8s中所能识别的对象。为了方便大家更全面的了解K8s的设计思想，本文对K8s的对象模型进行了梳理，同时在文章末尾

zhangxxxww 0喜欢 / 0评论 2020-05-28

Kubernetes实践之深入掌握Pod——Pod的升级和回滚

现在Pod镜像需要被更新为Nginx:1.9.1，我们可以通过kubectl set image命令为Deployment设置新的镜像名称。[ test]# kubectl describe pod -n test | grep Image. 假设在更新

薛正华 0喜欢 / 0评论 2020-05-28

kubernetes中的Project Volume

所以从容器角度来看，这类Volume就像是被投射进容器一样。Secret的作用是把Pod想要访问的加密数据存放到Etcd中，然后可以在Pod容器中通过挂载的方式访问Secret里保存的信息。一旦Secret被创建，就可以通过下面三种方式使用它：在创建Pod

风起于青萍之末 0喜欢 / 0评论 2020-05-27

kubernetes常用资源对象service入门介绍

对于kubernetes整个集群来说，Pod的地址也可变的，也就是说如果一个Pod因为某些原因退出了，而由于其设置了副本数replicas大于1，那么该Pod就会在集群的任意节点重新启动，这个重新启动的Pod的IP地址与原IP地址不同，这对于业务来说，就不

limx 0喜欢 / 0评论 2020-05-27

Kubernetes Ingress简单入门

本文转载自Rancher Labs不知道你是否注意到一个奇怪的现象，尽管Kubernetes Ingress API仍然处于beta状态，但是已经有许多公司使用它来暴露Kubernetes服务。从事相关项目的工程师表示，Kubernetes Ingress

yevvzi 0喜欢 / 0评论 2020-05-27

Kubernetes实践之深入掌握Pod——玩转Pod调度

多个优先级规则还可以设置权重值，以定义执行的先后顺序。虽然没有节点排斥功能，但是用NotIn和DoesNotExist就可以实现排斥的功能了。如果同时定义了nodeSelector和nodeAffinity，那么必须两个条件都得到满足，Pod才能最终

薛正华 0喜欢 / 0评论 2020-05-25

k8s limit/request 限制类型介绍

request容器使用的最小资源需求, 作为容器调度时资源分配的判断依赖。只有当前节点上可分配的资源量 >= request 时才允许将容器调度到该节点。request 和 limit 关系request能保证pod有足够的资源来运行, 而limit

容数据服务集结号 0喜欢 / 0评论 2020-05-20

k8s 设置deployment，时pod挂载本地时间问题同步底层时间到容器

name: time-localtimereadOnly: truemountPath: /etc/localtime 此设置不需要配置PodPreset，但针对java项目，可能会发生时区针对java程序无法生效

丽丽 0喜欢 / 0评论 2020-05-19

Kubernetes网络策略，这一篇就够了

目前许多组织都在采用Kubernetes来运行他们的应用程序。以至于有些人将Kubernetes称为新的数据中心操作系统。因此，组织开始将Kubernetes视为关键任务平台，它需要包括网络安全在内的成熟业务流程。例如，默认的Kubernetes策略是允许

cynthiachf 0喜欢 / 0评论 2020-05-14

kubernetes概念之一：概述

一个kubernetes集群都至少由一个Master节点和若干个Node节点组成。Master节点是集群控制节点，负责整个集群的管理和控制，基本上Kubernetes所有的控制命令都是发给它，它来负责具体的执行过程。由于Master节点的重要性，它通常会独

zccheu 0喜欢 / 0评论 2020-05-14