Kubernetes Pod 生命周期

作者: Anoyi

2018.07.21 13:50

Pod phase

Pod 的 status 属性是一个 PodStatus 对象,拥有一个 phase 字段。它简单描述了 Pod 在其生命周期的阶段。

阶段 描述
Pending Pod 已被 Kubernetes 接受,但尚未创建一个或多个容器镜像。这包括被调度之前的时间以及通过网络下载镜像所花费的时间,执行需要一段时间。
Running Pod 已经被绑定到了一个节点,所有容器已被创建。至少一个容器正在运行,或者正在启动或重新启动。
Succeeded 所有容器成功终止,也不会重启。
Failed 所有容器终止,至少有一个容器以失败方式终止。也就是说,这个容器要么已非 0 状态退出,要么被系统终止。
Unknown 由于一些原因,Pod 的状态无法获取,通常是与 Pod 通信时出错导致的。

Pod conditions

每个 Pod 都拥有一个 PodStatus,里面包含 PodConditions 数组,代表 Condition 是否通过。PodCondition 属性描述:

字段 描述
lastProbeTime 最后一次探测 Pod Condition 的时间戳。
lastTransitionTime 上次 Condition 从一种状态转换到另一种状态的时间。
message 上次 Condition 状态转换的详细描述。
reason Condition 最后一次转换的原因。
status Condition 状态类型,可以为 True False Unknown
type Condition 类型

关于 Condition Type 的描述:

Type 描述
PodScheduled Pod 已被调度到一个节点
Ready Pod 能够提供请求,应该被添加到负载均衡池中以提供服务
Initialized 所有 init containers 成功启动
Unschedulable 调度器不能正常调度容器,例如缺乏资源或其他限制
ContainersReady Pod 中所有容器全部就绪

Container probes

Probe 是在容器上 kubelet 的定期执行的诊断,kubelet 通过调用容器实现的 Handler 来诊断。目前有三种 Handlers :

  • ExecAction:在容器内部执行指定的命令,如果命令以状态代码 0 退出,则认为诊断成功。
  • TCPSocketAction:对指定 IP 和端口的容器执行 TCP 检查,如果端口打开,则认为诊断成功。
  • HTTPGetAction:对指定 IP + port + path路径上的容器的执行 HTTP Get 请求。如果响应的状态代码大于或等于 200 且小于 400,则认为诊断成功。

每次探测可能有如下之一的结果:

  • Success:容器诊断通过
  • Failure:容器诊断失败
  • Unknown:诊断失败,因此不应采取任何措施

kubelet 可以选择性地对运行中的容器进行两种探测器执行和响应:

  • livenessProbe:指示容器是否正在运行,如果活动探测失败,则 kubelet 会杀死容器,并且容器将受其 重启策略 的约束。如果不指定活动探测,默认状态是 Success
  • readinessProbe:指示容器是否已准备好为请求提供服务,如果准备情况探测失败,则控制器会从与 Pod 匹配的所有服务的端点中删除 Pod 的 IP 地址。初始化延迟之前的默认准备状态是 Failure,如果容器未提供准备情况探测,则默认状态为 Success

示例: spring-boot 应用的探测

apiVersion: apps/v1
kind: Deployment
metadata:
  ***
spec:
      ***
      containers:
        ***
        readinessProbe:                 # ---- 准备状态检查 ----
          httpGet:
            path: /actuator/health
            port: 8080
          timeoutSeconds: 2             # 探测超时时长,单位:秒
          initialDelaySeconds: 60       # 初始化时间,单位:秒
        livenessProbe:                  # ---- 健康状态检查 ----
          httpGet:
            port: 8080
            path: /actuator/info
          failureThreshold: 3           # 最大失败次数
          timeoutSeconds: 2             # 探测超时时长,单位:秒
          initialDelaySeconds: 60       # 初始化时间,单位:秒
          periodSeconds: 5              # 探测时间间隔,单位:秒
          successThreshold: 1           # 失败后探测成功的最小连续成功次数

Pod lifetime

通常,Pod 不会消失,除非人为或者控制器销毁它们。此规则的唯一例外情况是,SuccessFailed 阶段超过一段时间(由主服务器中的 terminate-pod-gc-threshold 确定)的 Pod 将过期并自动销毁。

三种可用的控制器类型:

  • Job:例如批量计算,仅适用于 restartPolicyOnFailureNever 的 Pod
  • ReplicationController, ReplicaSet, 或 Deployment:例如 Web 服务,ReplicationControllers 仅适用于 restartPolicyAlways 的 Pod。
  • DaemonSet:需要在每个节点运行一个的 Pod,以便用于系统服务。
评论

评论

昵称
邮箱