带着问题学 Kubernetes 架构
K8S 是什么,又为什么上手难度大?K8S 是一个基于容器技术的分布式集群管理系统,是谷歌几十年来大规模应用容器技术的经验积累和升华的一个重要成果。所以为了能够支持大规模的集群管理,它承载了很多的组件,而且分布式本身的复杂度就很高。
作者:CSDN云计算
来源:CSDN云计算
2017-07-12 09:55:15

打开这篇文章的同学,想必对 Docker 都不会陌生。Docker  是一种虚拟容器技术,它上手比较简单,只需在宿主机上起一个 Docker  Engine,然后就能愉快的玩耍了,如:拉镜像、起容器、挂载数据、映射端口等等。相对于 Kubernetes(K8S)的上手,可谓简单很多。

那么 K8S 是什么,又为什么上手难度大?K8S 是一个基于容器技术的分布式集群管理系统,是谷歌几十年来大规模应用容器技术的经验积累和升华的一个重要成果。所以为了能够支持大规模的集群管理,它承载了很多的组件,而且分布式本身的复杂度就很高。又因为 K8S 是谷歌出品的,依赖了很多谷歌自己的镜像,所以对于国内的同学环境搭建的难度又增加了一层。

下面,我们带着问题,一步步来看 K8S 中到底有哪些东西?

首先,既然是个分布式系统,那势必有多个 Node 节点(物理主机或虚拟机),它们共同组成一个分布式集群,并且这些节点中会有一个 Master 节点,由它来统一管理 Node 节点。

如图所示:

CSDN

问题一:主节点和工作节点是如何通信的呢?

首先,Master 节点启动时,会运行一个 kube-apiserver 进程,它提供了集群管理的 API 接口,是集群内各个功能模块之间数据交互和通信的中心枢纽,并且它页提供了完备的集群安全机制(后面还会讲到)。

在 Node 节点上,使用 K8S 中的 kubelet 组件,在每个 Node 节点上都会运行一个 kubelet 进程,它负责向 Master 汇报自身节点的运行情况,如 Node 节点的注册、终止、定时上报健康状况等,以及接收 Master 发出的命令,创建相应 Pod。

在 K8S 中,Pod 是最基本的操作单元,它与 docker 的容器有略微的不同,因为 Pod 可能包含一个或多个容器(可以是 docker 容器),这些内部的容器是共享网络资源的,即可以通过 localhost 进行相互访问。

关于 Pod 内是如何做到网络共享的,每个 Pod 启动,内部都会启动一个 pause 容器(google的一个镜像),它使用默认的网络模式,而其他容器的网络都设置给它,以此来完成网络的共享问题。

如图所示:

CSDN2

问题二:Master 是如何将 Pod 调度到指定的 Node 上的?

该工作由 kube-scheduler 来完成,整个调度过程通过执行一些列复杂的算法最终为每个 Pod 计算出一个最佳的目标 Node,该过程由 kube-scheduler 进程自动完成。常见的有轮询调度(RR)。当然也有可能,我们需要将 Pod 调度到一个指定的 Node 上,我们可以通过节点的标签(Label)和 Pod 的 nodeSelector 属性的相互匹配,来达到指定的效果。

如图所示:

CSDN3

关于标签(Label)与选择器(Selector)的概念,后面会进一步介绍。

问题三:各节点、Pod 的信息都是统一维护在哪里的,由谁来维护?

从上面的 Pod 调度的角度看,我们得有一个存储中心,用来存储各节点资源使用情况、健康状态、以及各 Pod 的基本信息等,这样 Pod 的调度来能正常进行。

在 K8S 中,采用 etcd 组件 作为一个高可用强一致性的存储仓库,该组件可以内置在 K8S 中,也可以外部搭建供 K8S 使用。

集群上的所有配置信息都存储在了 etcd,为了考虑各个组件的相对独立,以及整体的维护性,对于这些存储数据的增、删、改、查,统一由 kube-apiserver 来进行调用,apiserver 也提供了 REST 的支持,不仅对各个内部组件提供服务外,还对集群外部用户暴露服务。

外部用户可以通过 REST 接口,或者 kubectl 命令行工具进行集群管理,其内在都是与 apiserver 进行通信。

如图所示:

CSDN4

问题四:外部用户如何访问集群内运行的 Pod ?

前面讲了外部用户如何管理 K8S,而我们更关心的是内部运行的 Pod 如何对外访问。使用过Docker 的同学应该知道,如果使用 bridge 模式,在容器创建时,都会分配一个虚拟 IP,该 IP 外部是没法访问到的,我们需要做一层端口映射,将容器内端口与宿主机端口进行映射绑定,这样外部通过访问宿主机的指定端口,就可以访问到内部容器端口了。

那么,K8S 的外部访问是否也是这样实现的?答案是否定的,K8S 中情况要复杂一些。因为上面讲的 Docker 是单机模式下的,而且一个容器对外就暴露一个服务。在分布式集群下,一个服务往往由多个 Application 提供,用来分担访问压力,而且这些 Application 可能会分布在多个节点上,这样又涉及到了跨主机的通信。

这里,K8S 引入了 Service 的概念,将多个相同的 Pod 包装成一个完整的 service 对外提供服务,至于获取到这些相同的 Pod,每个 Pod 启动时都会设置 labels 属性,在 Service 中我们通过选择器 Selector,选择具有相同 Name 标签属性的 Pod,作为整体服务,并将服务信息通过 Apiserver 存入 etcd 中,该工作由 Service Controller 来完成。同时,每个节点上会启动一个 kube-proxy 进程,由它来负责服务地址到 Pod 地址的代理以及负载均衡等工作。

如图所示:

CSDN5

问题五:Pod 如何动态扩容和缩放?

既然知道了服务是由 Pod 组成的,那么服务的扩容也就意味着 Pod 的扩容。通俗点讲,就是在需要时将 Pod 复制多份,在不需要后,将 Pod 缩减至指定份数。K8S 中通过 Replication Controller 来进行管理,为每个 Pod 设置一个期望的副本数,当实际副本数与期望不符时,就动态的进行数量调整,以达到期望值。期望数值可以由我们手动更新,或自动扩容代理来完成。

如图所示:

CSDN6

问题六:各个组件之间是如何相互协作的?

最后,讲一下 kube-controller-manager 这个进程的作用。我们知道了 ectd 是作为集群数据的存储中心, apiserver 是管理数据中心,作为其他进程与数据中心通信的桥梁。而 Service Controller、Replication Controller 这些统一交由 kube-controller-manager 来管理,kube-controller-manager 作为一个守护进程,每个 Controller 都是一个控制循环,通过 apiserver 监视集群的共享状态,并尝试将实际状态与期望不符的进行改变。关于 Controller,manager 中还包含了 Node 节点控制器(Node Controller)、资源配额管控制器(ResourceQuota Controller)、命名空间控制器(Namespace Controller)等。

如图所示:

CSDN7

总结

本文通过问答的方式,没有涉及任何深入的实现细节,从整体的角度,概念性的介绍了 K8S 中涉及的基本概念,其中使用相关的包括有:

1.Node

2.Pod

3.Label

4.Selector

5.Replication Controller

6.Service Controller

7.ResourceQuota Controller

8.Namespace Controller

9.Node Controller

以及运行进程相关的有:

1.kube-apiserver

2.kube-controller-manager

3.kube-scheduler

4.kubelet

5.kube-proxy

6.pause

这也是我学习 K8S 后对其整体架构的一次总结,因为刚上手时,阅读官方文档,确实被如此多的内容搞得有点晕,所在在这里进行了简单的梳理。文中有理解不到位的地方,欢迎指正!

关注中国IDC圈官方微信:idc-quan或微信号:821496803 我们将定期推送IDC产业最新资讯

查看心情排行你看到此篇文章的感受是:


  • 支持

  • 高兴

  • 震惊

  • 愤怒

  • 无聊

  • 无奈

  • 谎言

  • 枪稿

  • 不解

  • 标题党
2019-07-02 09:02:06
云资讯 未来的Kubernetes将效仿Facebook的做法
如果你想知道Kubernetes容器管理系统的未来会是什么样子,那么Facebook自2011年以来一直在使用和发展的封闭源代码、自主研发的Tupperware容器控制系统(Docker容器以及Kuber <详情>
2019-06-17 09:21:39
5G新知 面向5G,边缘计算应运而生
随着5G业务的到来,边缘云资源池必然从单一类型虚机/裸机资源池向虚机/裸机、容器多种资源池并存方向演进 <详情>
2019-06-05 15:45:00
大数据资讯 数据库AntDB通过信通院金融分布式事务数据库标准测试
近日,亚信科技的数据库产品AISWare AntDB顺利通过由中国信息通信研究院云计算与大数据研究所专家组织的金融分布式事务数据库标准测试。 <详情>
2019-05-15 16:56:54
机房建设 在数据中心观察的四个关键Kubernetes增长向量
2014年6月,谷歌公司开源了Kubernetes,这是一个基于软件的容器编排平台,可管理运行谷歌公司的的数十万台服务器。 <详情>
2019-05-10 14:58:22
云资讯 Kubernetes如何降低云的复杂性
Kubernetes过度用于安全性和基础设施,但未充分用于自动化。那些最需要它的人并没有意识到它的潜力。 <详情>
2019-01-03 14:04:59
市场情报 从分布式视角看大数据与AI平台的构建
云计算,赋予IT资源可伸缩的力量,从而可以整合算力,为各种新技术提供表演的舞台,同时也为社会积蓄了丰富的资源,为大数据、人工智能提供底层技术的支撑。大数据技术则将 <详情>
2018-12-26 14:50:04
市场情报 大话云上“分布式实践”,理解 B、A、C 并不难!
云计算,惊喜于可伸缩与算力集合;大数据、人工智能带给我们无可比拟的技术震撼;细探究竟,这三种技术都无法离开一个关键点,那就是经常被圈内人提及的“分布式”。 <详情>
2018-11-15 10:33:20
云资讯 腾讯云分布式技术助力光大银行互联网架构转型
近日消息,继合作共建金融科技创新实验室后,腾讯云与光大银行日前宣布又一项重要合作进展。光大银行将基于腾讯云分布式服务框架TSF构建新一代系统架构,打造稳定、安全、便捷 <详情>
2018-11-08 11:51:00
云资讯 VMware收购Kubernetes核心创业团队Heptio,在打什么"云"算盘?
中国IDC圈讯 11月8日消息 一夜之间VMware收购Kubernetes核心创业团队Heptio的消息传遍容器圈,此举也被理解为VMware有意加强基于容器化架构和开源生态,使用云进一步颠覆 <详情>
2018-10-10 15:34:40
云技术 2019年的云端:多云、无服务器计算和Kubernetes容器
企业正在迅速从基础设施服务向云服务平台转移。多云技术的使用和部署量增加了一倍,其中亚马逊网络服务处于领先地位,但微软Azure和谷歌云平台的发展势头强劲。 <详情>

CSDN云计算

阅读量
阅读排行榜