地域故障转移

阅读大约需要 2 分钟页面测试

请按照本指南为您的网格配置地域故障转移。

在开始之前，一定要完成开始之前这一节包含的步骤。

在此任务中，您将使用 Sleep Pod 在 region1.zone1 作为请求源发送到 HelloWorld 服务。然后，您将触发故障，这些故障将按照以下顺序导致不同地域之间的故障转移：

在内部，Envoy 优先级用于控制故障转移。这些优先级将按照以下方式分配来自 Sleep Pod（在 region1 zone1）的流量：

优先级	地域	细节
0	`region1.zone1`	地区、区域、分区全部匹配。
1	None	由于此任务不使用分区，因此没有其他分区的匹配项。
2	`region1.zone2`	同一个地区内的不同区域。
3	`region2.zone3`	没有匹配项，但是为 `region1`->`region2` 定义了故障转移。
4	`region3.zone4`	没有匹配项并且没有为 `region1`->`region3` 定义故障转移。

配置地域故障转移

应用一个 DestinationRule 配置如下：

针对 HelloWorld 服务的故障检测。这是故障转移正常运行所必需的。特别是，它可以配置 Sidecar 代理以了解服务的 Endpoint 何时会不正常，最终触发故障转移到下一个地域。
故障转移地区之间的策略，这确保了超出地区边界的故障转移将具有可预测的行为。
连接池强制每个HTTP请求使用一个新连接的策略。该任务利用 Envoy 的逐出功能强制将故障转移到下一个位置。一旦逐出，Envoy 将拒绝所有新的请求。由于每个请求都使用一个新连接，这将导致在耗尽后立即进行故障转移。此配置仅用于演示目的。

$ kubectl --context="${CTX_PRIMARY}" apply -n sample -f - <<EOF
apiVersion: networking.istio.io/v1
kind: DestinationRule
metadata:
  name: helloworld
spec:
  host: helloworld.sample.svc.cluster.local
  trafficPolicy:
    connectionPool:
      http:
        maxRequestsPerConnection: 1
    loadBalancer:
      simple: ROUND_ROBIN
      localityLbSetting:
        enabled: true
        failover:
          - from: region1
            to: region2
    outlierDetection:
      consecutive5xxErrors: 1
      interval: 1s
      baseEjectionTime: 1m
EOF

验证流量保持在 `region1.zone1`

从 Sleep Pod 调用 HelloWorld 服务：

$ kubectl exec --context="${CTX_R1_Z1}" -n sample -c sleep \
  "$(kubectl get pod --context="${CTX_R1_Z1}" -n sample -l \
  app=sleep -o jsonpath='{.items[0].metadata.name}')" \
  -- curl -sSL helloworld.sample:5000/hello
Hello version: region1.zone1, instance: helloworld-region1.zone1-86f77cd7b-cpxhv

验证响应中的 version 是 region1.zone。

重复几次，验证响应总是相同的。

故障转移到 `region1.zone2`

接下来，触发故障转移到 region1.zone2。为此，您在 region1.zone1 中 HelloWorld 逐出 Envoy Sidecar 代理：

$ kubectl --context="${CTX_R1_Z1}" exec \
  "$(kubectl get pod --context="${CTX_R1_Z1}" -n sample -l app=helloworld \
  -l version=region1.zone1 -o jsonpath='{.items[0].metadata.name}')" \
  -n sample -c istio-proxy -- curl -sSL -X POST 127.0.0.1:15000/drain_listeners

从 Sleep Pod 调用 HelloWorld 服务：

$ kubectl exec --context="${CTX_R1_Z1}" -n sample -c sleep \
  "$(kubectl get pod --context="${CTX_R1_Z1}" -n sample -l \
  app=sleep -o jsonpath='{.items[0].metadata.name}')" \
  -- curl -sSL helloworld.sample:5000/hello
Hello version: region1.zone2, instance: helloworld-region1.zone2-86f77cd7b-cpxhv

第一个调用将失败，这将触发故障转移。多次重复该命令，并验证响应中的 version 始终为 region1.zone2。

故障转移到 `region2.zone3`

现在触发故障转移到 region2.zone3。正如您之前所做的，配置 HelloWorld 在 region1.zone2 中调用失败。

$ kubectl --context="${CTX_R1_Z2}" exec \
  "$(kubectl get pod --context="${CTX_R1_Z2}" -n sample -l app=helloworld \
  -l version=region1.zone2 -o jsonpath='{.items[0].metadata.name}')" \
  -n sample -c istio-proxy -- curl -sSL -X POST 127.0.0.1:15000/drain_listeners

从 Sleep Pod 调用 HelloWorld 服务：

$ kubectl exec --context="${CTX_R1_Z1}" -n sample -c sleep \
  "$(kubectl get pod --context="${CTX_R1_Z1}" -n sample -l \
  app=sleep -o jsonpath='{.items[0].metadata.name}')" \
  -- curl -sSL helloworld.sample:5000/hello
Hello version: region2.zone3, instance: helloworld-region2.zone3-86f77cd7b-cpxhv

第一个调用将失败，这将触发故障转移。多次重复该命令，并验证响应中的 version 始终为 region2.zone3。

故障转移到 `region3.zone4`

现在触发故障转移到 region3.zone4。正如您之前所做的，配置 HelloWorld 在 region2.zone3 中调用失败。

$ kubectl --context="${CTX_R2_Z3}" exec \
  "$(kubectl get pod --context="${CTX_R2_Z3}" -n sample -l app=helloworld \
  -l version=region2.zone3 -o jsonpath='{.items[0].metadata.name}')" \
  -n sample -c istio-proxy -- curl -sSL -X POST 127.0.0.1:15000/drain_listeners

从 Sleep Pod 调用 HelloWorld 服务：

$ kubectl exec --context="${CTX_R1_Z1}" -n sample -c sleep \
  "$(kubectl get pod --context="${CTX_R1_Z1}" -n sample -l \
  app=sleep -o jsonpath='{.items[0].metadata.name}')" \
  -- curl -sSL helloworld.sample:5000/hello
Hello version: region3.zone4, instance: helloworld-region3.zone4-86f77cd7b-cpxhv

第一次调用将失败，这将触发故障转移。多次重复该命令，并验证响应中的 version 始终为 region3.zone4。

恭喜！ 您成功配置了地域故障转移！

下一步

清除此任务中的资源和文件。

地域故障转移

配置地域故障转移

验证流量保持在 region1.zone1

故障转移到 region1.zone2

故障转移到 region2.zone3

故障转移到 region3.zone4

下一步

验证流量保持在 `region1.zone1`

故障转移到 `region1.zone2`

故障转移到 `region2.zone3`

故障转移到 `region3.zone4`