简括:首先kubectl向 API 接口发送指令,随后kube-api 会调度到我们的kubelet,这个调度过程是由我们的etcd完成的存储,随后kubelet操作CRI ,由CRI完成容器环境的初始化。在初始化的过程中会先启动一个pause的基础容器(谷歌制作的一个非常简洁的一个容器),pause容器负责pod中容器的网络已经存心卷共享的。随后,pause进行一个或者多个或者没有 init C 的初始化。init初始化完成了。会正常退出。退出码为0,如果非零为不正常,会再根据我们的重定策略去判断是否继续重新执行。多个初始化的容器做完了之后,会进入到主容器main C .main C 在刚运行的时候,我们可以允许它启动一条命令,或者执行一个脚本都可以。main C 在结束的时候也会执行一个STOP的命令,交代一下后事,这个过程中会有readiness和liveness的参与,readiness只有成功检测了。pod的状态才会ready或者running。当我们的主容器里面的进程和liveness中检测不一致时候,那么就可以执行对应的重启命令,或者删除。
Pod 是 kubernetes 系统的基础单元,是由用户创建或部署的最小组件,也是 kubernetes 系统上运行容器化应用的资源对象。Kubernetes 集群中其他资源对象都是为 pod 这个资源对象做支撑来实现 kubernetes 管理应用服务的目的。 Kubernetes 集群组件主要包括主节点组件API Server、Controller Manager、Scheduler 以及子节点组件 kubelet、container Runtime(如docker)、kube-proxy 等。从与集群各组件交互角度讲述 pod 的创建、运行、销毁等生命周期,Pod 生命周期中的几种不同状态包括pending、running、succeeded、failed、Unknown。
API Server 提供了集群与外部交互的接口,通过 kubectl 命令或者其他 API 客户端提交 pod spec 给 API Server 作为pod创建的起始。 Pod 与 API Server 交互的主要流程如下:
当提交创建 pod 的请求与 API Server 的交互完成之后,接下来由 scheduler 进行工作,该组件主要是完成 pod 的调度来决定 pod 具体运行在集群的哪个节点上。注意,此处声明一点,API Server 完成任务之后,将信息写入到 etcd 中,此时 scheduler 通过 watch 机制监听到写入到 etcd 的信息然后再进行工作。 Scheduler 读取到写入到 etcd 中的 pod 信息,然后基于一系列规则从集群中挑选一个合适的节点来运行它,调度时主要通过三步来确定 pod 运行节点:
注:如果有特殊 pod 资源需要运行在特殊节点上,此时可以通过组合节点标签以及 pod 标签和标签选择器等来实现高级调度,如 MatchInterPodAffinity、MatchNodeSelector 和 PodToleratesNodeTaints 等预选策略,他们为用户提供自定义 Pod 亲和性或反亲和性、节点亲和性以及基于污点及容忍度的调度机制。
当 scheduler 通过一系列策略选定 pod 运行节点之后将结果信息更新至 API Server,由 API Server 更新至 etcd 中,并由 API Server 反映调度结果,接下来由 kubelet 在所选定的节点上启动 pod。
kubelet 组件的作用不单单是创建 pod,另外还包括节点管理、cAdvisor 资源监控管理、容器健康检查等功能。 启动pod流程分析 kubelet 通过 API Server 监听 etcd 目录,同步 pod 列表。如果发现有新的 pod 绑定到本节点,则按照 pod 清单要求创建 pod,如果是发现 pod 被更新,则做出相应更改。 读取到 pod 的信息之后,如果是创建和修改 pod 的任务,则做如下处理:
详述pod声明周期中的重要行为 除了创建应用容器(主容器及辅助容器之外,注意,如果集群中部署了 istio,则会在 pod 启动的时候注入一个新的和 istio 相关的容器,那是另一个美好故事的开端),还可以为 pod 对象定义其声明周期中的多种行为,如初始化容器、容器探测以及就绪性探测等。 容器生命周期的几种行为 初始化容器 初始化容器即 pod 内主容器启动之前要运行的容器,主要是做一些前置工作,初始化容器具有以下特征:
声明周期钩子函数
备注:钩子程序的执行方式有“Exec”和“HTTP”两种。 容器探测 容器探测分为存活性探测和就绪性探测容器探测是kubelet对容器健康状态进行诊断,容器探测的方式主要以下三种:
Pod终止过程 终止过程主要分为如下几个步骤:
此外 kubelet 除了启动之外,kubelet 中还有 cAdvisor,用于收集容器 CPU、内存、文件系统和网络使用情况等信息,与 prometheus 结合实现对集群内 pod 监控。 此外,除了上述三个组件在创建 pod 过程中的交互,还有 controller-manager 来保证 pod 处于用户期望状态(即保证 pod 永远处于存活状态)等功能以及 proxy 用于集群内 pod 之间通信等。