LightStep

此任务介绍如何配置 Istio 才能收集追踪 span ,并且把收集到的 span 发送到 LightStep TracingLightStep [𝑥]PM。 LightStep 可以分析来自大规模生产级软件的 100% 未采样的事务数据,并做出容易理解的的分布式追踪和指标信息,这有助于解释性能行为和并加速根因分析。 在此任务的结尾,Istio 将追踪 span 从代理发送到 LightStep Satellite 池,以让它们在 web UI 上展示。

此任务使用 Bookinfo 的样例代码作为示例。

开始之前

  1. 确保你有一个 LightStep 账户。这里可以免费注册试用 LightStep Tracing,或者联系 LightStep 创建企业级的 LightStep [𝑥]PM 账户。

  2. 对于 [𝑥]PM 用户,确保你已有 satellite 池并且配置了 TLS 证书和一个暴露出来的安全 GRPC 端口。这里配置 LightStep Satellite 有配置 satellite 的详细说明。

    对于 LightStep Tracing 的用户,你的 satellites 是已经配置好的。

  3. 确保你有 LightStep 的访问令牌

  4. 需要使用你的 satellite 地址来部署 Istio。 对于 [𝑥]PM 用户,确保你可以使用 <Host>:<Port> 格式的地址访问 satellite 池,例如 lightstep-satellite.lightstep:9292

    对于 LightStep Tracing 的用户,使用这个地址 collector-grpc.lightstep.com:443

  5. 使用以下指定的配置参数部署 Istio:

    • pilot.traceSampling=100
    • global.proxy.tracer="lightstep"
    • global.tracer.lightstep.address="<satellite-address>"
    • global.tracer.lightstep.accessToken="<access-token>"
    • global.tracer.lightstep.secure=true
    • global.tracer.lightstep.cacertPath="/etc/lightstep/cacert.pem"

    当执行安装命令时,可以使用 --set key=value 语法来配置这些参数,例如:

    $ istioctl manifest apply \
        --set values.pilot.traceSampling=100 \
        --set values.global.proxy.tracer="lightstep" \
        --set values.global.tracer.lightstep.address="<satellite-address>" \
        --set values.global.tracer.lightstep.accessToken="<access-token>" \
        --set values.global.tracer.lightstep.secure=true \
        --set values.global.tracer.lightstep.cacertPath="/etc/lightstep/cacert.pem"
    
  6. 把 satellite 池证书颁发机构发的证书作为一个密钥存储在默认的命名空间下。 对于 LightStep Tracing 用户,要在这里下载并使用这个证书。 如果你把 Bookinfo 应用程序部署在了其它的命名空间下,就要在对的应命名空间下创建相应的密钥证书。

    $ CACERT=$(cat Cert_Auth.crt | base64) # Cert_Auth.crt contains the necessary CACert
    $ NAMESPACE=default
    
    $ cat <<EOF | kubectl apply -f -
      apiVersion: v1
      kind: Secret
      metadata:
        name: lightstep.cacert
        namespace: $NAMESPACE
        labels:
          app: lightstep
      type: Opaque
      data:
        cacert.pem: $CACERT
    EOF
    
  7. 按照部署 Bookinfo 示例应用程序说明操作。

可视化追踪数据

  1. 按照为 Bookinfo 应用程序创建 ingress 网关说明操作。

  2. 为了验证上一步是否成功,请确认你在 shell 的环境变量中中设置了 GATEWAY_URL

  3. 发送流量到示例应用程序。

    $ curl http://$GATEWAY_URL/productpage
    
  4. 打开 LightStep web UI

  5. 导航到 Explorer 。

  6. 在顶部找到查询栏,在这里你可以用 ServiceOperationTag 的值进行过滤查询。

  7. Service 下拉列表中选择 productpage.default

  8. 点击 Run 。可以看到如下类似的内容:

    Explorer
    Explorer
  9. 在延迟直方图下面点击示例追踪表格的第一行,就可以查看 /productpage 刷新后的详细信息。该页面类似下面:

    Detailed Trace View
    Detailed Trace View

这个截图显示了该追踪是由一组 span 组成。每一个 span 对应着在执行 /productpage 请求期间调用的一个 Bookinfo 服务。

追踪中的两个 spans 表示一个 RPC 请求。例如,从 productpagereviews 的请求调用,以操作标签 reviews.default.svc.cluster.local:9080/* 和服务标签 productpage.default: proxy client 的 span 开始。该服务表示是这个调用的客户端 span。截图显示此次调用耗时 15.30 毫秒。第二个 span 标记有操作标签 reviews.default.svc.cluster.local:9080/* 操作和服务标签 reviews.default: proxy server 。第二个 span 是第一个 span 的下一级,表示调用的服务端 span。截图显示此次调用耗时 14.60 毫秒。

追踪采样

Istio 通过配置追踪采样百分比来捕获追踪信息。想了解如何修改追踪采样百分比,请访问分布式追踪追踪采样部分。 使用 LightStep 时,我们不建议将追踪采样的百分比降低到 100% 以下。要处理高流量的网格,请考虑扩大您的 satellite 池的大小。

清除

如果你不想继续执测试操作任务,可以从集群中删除 Bookinfo 示例应用程序和所有的 LightStep 密钥。

  1. 删除 Bookinfo 应用程序,请参阅清除 Bookinfo 说明。

  2. 删除给 LightStep 生成的密钥:

$ kubectl delete secret lightstep.cacert
这些信息有用吗?
Do you have any suggestions for improvement?

Thanks for your feedback!