部署模型

当您将 Istio 用于生产环境部署时,需要回答一系列的问题。 网格将被限制在单个 集群 中还是分布在多个集群中? 是将所有服务都放置在单个完全连接的网络中,还是需要网关来跨多个网络连接服务? 是否存在单个控制平面(可能在集群之间共享),或者是否部署了多个控制平面以确保高可用(HA)? 如果要部署多个集群(更具体地说是在隔离的网络中),是否要将它们连接到单个多集群服务网格中, 还是将它们联合到一个 多网格 部署中?

所有这些问题,都代表了 Istio 部署的独立配置维度。

  1. 单一或多个集群
  2. 单一或多个网络
  3. 单一或多控制平面
  4. 单一或多个网格

所有组合都是可能的,尽管某些组合比其他组合更常见,并且某些组合显然不是很有趣(例如,单一集群中有多个网格)。

在涉及多个集群的生产环境部署中,部署可能使用多种模式。 例如,基于 3 个集群实现多控制平面的高可用部署,您可以通过使用单一控制平面部署 2 个集群,然后再添加第 3 个集群和 第 2 个控制平面来实现这一点,最后,再将所有 3 个集群配置为共享 2 个控制平面,以确保所有集群都有 2 个控制源来确保 HA。

如何选择正确的部署模型,取决于您对隔离性、性能和 HA 的要求。本指南介绍了配置 Istio 部署时的各种选择和注意事项。

集群模型

应用程序的工作负载实例运行在一个或多个集群中。 针对隔离性、性能和高可用的需求,您还可以将集群限制在可用区和地域中。

根据需求,生产系统可以跨多个集群(基于多可用区、多地域)运行, 借助云负载均衡器来处理诸如本地、区域或地域性故障转移之类的问题。

大多数情况下,集群代表着配置和端点发现的边界。 例如,每个 Kubernetes 集群都有一个 API 服务器,该服务器管理集群的配置, 在 Pod 变化时提供 服务端点 信息。 Kubernetes 在每个集群都默认配置此行为,这有助于限制由错误配置引起的潜在风险。

在 Istio 中,您可以配置单一服务网格以跨越任意数量的集群。

单一集群

在最简单的情况下,您可以将 Istio 网格限制为单一集群。 集群通常在单一网络上运行,但是在不同的基础架构之间会有所不同。 单一集群和单一网络模型包括一个控制平面,这是最简单的 Istio 部署。

单一集群服务网格
单一集群服务网格

单一集群部署提供了简单性,但缺少更多的功能,例如,故障隔离和故障转移。 如果您需要高可用性,则应使用多个集群。

多集群

您可以将单个网格配置为包括多集群。 在单一网格中使用多集群部署,与单一集群部署相比其具备以下更多能力:

  • 故障隔离和故障转移:当 cluster-1 下线,业务将转移至 cluster-2
  • 位置感知路由和故障转移:将请求发送到最近的服务。
  • 多种控制平面模型:支持不同级别的可用性。
  • 团队或项目隔离:每个团队仅运行自己的集集群。
多集群服务网格
多集群服务网格

多集群部署可为您提供更大程度的隔离和可用性,但会增加复杂性。 如果您的系统具有高可用性要求,则可能需要集群跨多个可用区和地域。 对于应用变更或新的版本,您可以在一个集群中配置金丝雀发布,这有助于把对用户的影响降到最低。 此外,如果某个集群有问题,您可以暂时将流量路由到附近的集群,直到解决该问题为止。

您可以根据网络和云提供商所支持的选项来配置集群间通信。 例如,若两个集群位于同一基础网络,则可以通过简单地配置防火墙规则来启用跨集群通信。

网络模型

许多生产系统需要多个网络或子网来实现隔离和高可用性。 Istio 支持跨多种网络拓扑扩展服务网格。 这使您可以选择适合您现有网络拓扑的网络模型。

单一网络

在最简单的情况下,服务网格在单个完全连接的网络上运行。 在单一网络模型中, 工作负载实例 都可以直接相互访问,而无需 Istio 网关。

单一网络模型允许 Istio 以统一的方式在网格上配置服务使用者,从而能够直接处理工作负载实例。

单一网络服务网格
单一网络服务网格

多网络

您可以配置单个服务网格跨多个网络,这样的配置称为多网络

多网络模型提供了单一网络之外的以下功能:

  • 服务端点范围的 IP 或 VIP 重叠
  • 跨越管理边界
  • 容错能力
  • 网络地址扩展
  • 符合网络分段要求的标准

在此模型中,不同网络中的工作负载实例只能通过一个或多个 Istio 网关相互访问。Istio 使用 分区服务发现 为消 费者提供 服务端点 的不同视图。该视图取决于消费者的网络。

多网络服务网格
多网络服务网格

控制平面模型

Istio 网格使用控制平面来配置网格内工作负载实例之间的所有通信。 您可以复制控制平面,工作负载实例可以连接到任何一个控制平面实例以获取其配置。

在最简单的情况下,可以在单一集群上使用控制平面运行网格。

单一控制平面服务网格
单一控制平面服务网格

多集群部署也可以共享控制平面实例。在这种情况下,控制平面实例可以驻留在一个或多个集群中。

跨两个集群共享控制平面的服务网格
跨两个集群共享控制平面的服务网格

为了获得高可用性,您应该在多个集群、区或地域之间部署控制平面。

每个地域都有控制平面实例的服务网格
每个地域都有控制平面实例的服务网格

该模型具有以下优点:

  • 更强的可用性:如果控制平面不可用,则中断范围仅限于该控制平面。

  • 配置隔离:您可以在一个集群、区域或地域中进行配置更改,而不会影响其他集群、区或或地域。

您可以通过故障转移来提高控制平面的可用性。当控制平面实例不可用时,工作负载实例可以连接到另一个可用的控制平面实例。 故障转移可能发生在集群、区域或地域之间。

控制平面实例失败后的服务网格
控制平面实例失败后的服务网格

以下列表按可用性对控制平面部署进行了排名:

  • 每个地域一个集群(最低可用性
  • 每个地域多个集群
  • 每个区域一个集群
  • 每个区域多个集群
  • 每个集群(最高可用性

身份和信任模型

在服务网格中创建工作负载实例时,Istio 会为工作负载分配一个身份标识

证书颁发机构(CA)创建并签名身份标识的证书,以用于验证网格中的使用者身份,您可以使用其公钥来验证消息发送者的身份。 trust bundle 是一组在 Istio 网格使用的所有 CA 公钥的集合。使用 trust bundle 任何人都可以验证来自该网格的任何消息发送者。

网格内的信任

在单一 Istio 网格中,Istio 确保每个工作负载实例都有一个表示自己身份的适当证书,以及用于识别网格及网格联邦中所有身份 信息的 trust bundle。CA 只为这些身份标识创建和签名证书。该模型允许网格中的工作负载实例通信时相互认证。

具有证书颁发机构的服务网格
具有证书颁发机构的服务网格

网格之间的信任

如果网格中的服务需要另一个网格中的服务,则必须在两个网格之间联合身份和信任。要在不同网格之间联合身份和信任,必须交换网格的 trust bundle。 您可以使用像 SPIFFE 信任域联邦 之类的协议手动或自动交换 trust bundle,将 trust bundle 导入网格后,即可为这些身份配置本地策略。

具有证书颁发机构的多服务网格
具有证书颁发机构的多服务网格

网格模型

Istio 支持将您的所有服务都放在一个服务网格中, 或者将多个网格联合在一起,这也称为多网格

单一网格

最简单的 Istio 部署是单一网格。网格内,服务名称是唯一的。例如,在命名空间 foo 中只能存在一个名为 mysvc 的服务。 此外,工作负载实例具有相同的标识,因为服务帐户名称在命名空间中也是唯一的,就像服务名称一样。

单一网格可以跨越一个或多个集群一个或多个网络。 网格内部,命名空间用于多租户

多网格

通过网格联邦可以实现多网格部署。

与单一网格相比,多网格具备以下更多功能:

  • 组织边界:业务范围
  • 服务名称或命名空间复用:比如 default 的使用
  • 加强隔离:将测试工作负载与生产工作负载隔离

您可以使用网格联邦启用网格间通信。 联合时,每个网格可以公开一组服务和身份,它们可以被所有参与的网格都可以识别。

多服务网格
多服务网格

为避免服务命名冲突,可以为每个网格赋予全局唯一的 mesh ID,以确保每个服务的完全限定域名(FQDN)是不同的。

联合两个不共享同一信任域的网格时, 必须 联合身份标识和它们之间的 trust bundles。有关概述请参考多信任域部分。

租户模型

在 Istio 中,租户是一组用户,它们共享对一组已部署工作负载的公共访问权限。通常,您可以通过网络配置和策略将工作负载实例与多个租户彼此隔离。

您可以配置租户模型以满足以下组织隔离要求:

  • 安全
  • 策略
  • 容量(Capacity)
  • 成本(Cost)
  • 性能

Istio 支持两种类型的租赁模型:

命名空间租赁

Istio 使用命名空间作为网格内的租赁单位。 Istio 还可以在未实现命名空间租用的环境中使用。在这样的环境中,您可以授予团队权限,以仅允许其将工作负载部署到给定的或一组命名空间。 默认情况下,来自多个租赁命名空间的服务可以相互通信。

具有两个隔离的命名空间的服务网格
具有两个隔离的命名空间的服务网格

为提高隔离性,您可以有选择地将部分服务公开给其他命名空间。您可以为公开服务配置授权策略,以将访问权限仅交给适当的调用者。

具有两个命名空间和一个公开服务的服务网格
具有两个命名空间和一个公开服务的服务网格

多集群场景中,不同集群中名字相同的命名空间,被认为是相同的命名空间。 例如,集群 cluster-1 中命名空间 foo 下的服务 Service B 与集群 cluster-2 中命名空间 foo 下的服务 Service B, 指向的是相同的服务,Istio 会合并这些服务端点,用于服务发现和负载均衡。

具有相同命名空间的多集群服务网格
具有相同命名空间的多集群服务网格

集群租户模型

Istio 还支持使用集群作为租赁单位。在这种情况下,您可以为每个团队提供一个专用集群或一组集群来部署其工作负载。 集群的权限通常仅限于拥有它的团队和成员。您可以设置各种角色以实现更精细的控制,例如:

  • 集群管理员
  • 开发者

要在 Istio 中使用集群租用,请将每个集群配置为一个独立的网格。或者,您可以使用 Istio 将一组集群实现为单一租户。 然后,每个团队可以拥有一个或多个集群,但是您可以将所有集群配置为单一网格。 要将各个团队的网格连接在一起,可以将网格联合成一个多网格部署。

具有两个集群和两个命名空间的隔离的服务网格
具有两个集群和两个命名空间的隔离的服务网格

由于每个网格都由不同的团队或组织来管理,因此服务命名不需要担心冲突。 例如,集群 cluster-1 中命名空间 foo 下的服务 mysvc 与集群 cluster-2 中命名空间 foo 下的服务 mysvc, 不是指相同的服务。最常见的示例是在 Kubernetes 中的场景,其中许多团队将其工作负载部署到 default 命名空间。

当每个团队都有自己的网格时,跨网格通信遵循多网格模型中描述的概念。

这些信息有用吗?
Do you have any suggestions for improvement?

Thanks for your feedback!