注册配置治理服务限流

说明：
当前 TSF Consul 已经转为内测，如果您有服务注册配置治理的需求，请您购买 Polaris（北极星）。
场景说明
服务限流主要是保护服务节点或者数据节点，防止瞬时流量过大造成服务和数据崩溃，导致服务不可用。当资源成为瓶颈时，服务框架需要对请求做限流，启动流控保护机制。
功能说明
限流的原理是监控服务流量的 QPS 指标，当达到指定的阈值时进行流量控制，避免被瞬时高峰流量冲垮，从而确保服务的高可用。
TSF 目前支持在被调服务上设置限流规则，限流模式有两种：
单机限流：适合用于给每个服务实例设置兜底保护。
集群限流：适合用于设置整个服务的流量上限。
服务的限流对象（下文中称为“限流资源”）可以通过标签表达式灵活配置，常见的限流对象如当前服务、当前服务的特定 API 等，并且可以通过标签表达式区分不同的调用来源，针对不同的调用关系进行限流。一条限流规则主要包括以下几个元素：
限流粒度：支持服务整体限流和基于标签限流，基于标签限流是指通过标签表达式表示被调方的限流资源和调用来源。
限流阈值：支持按照请求数（如果单位时间设置为1秒，则限流阈值为 QPS）或者并发线程数（仅Spring Cloud F G H 2020 1.40之后版本支持）限流。
生效状态：限流规则是否生效。
﻿
﻿
﻿
应用场景
场景1：根据调用方进行限流
调用关系中包括调用方和被调用方，一个被调服务可能同时被多个服务调用。在限流规则中，限流粒度字段可以用于根据调用来源进行流量控制，举例如下：
不区分调用者：限流粒度选择服务整体限流时，来自任何调用者的请求都将进行限流统计。如果限流资源的调用总和超过了这条规则定义的阈值，则触发限流。
针对特定的调用者：限流粒度选择基于标签限流，设置系统标签为上游服务名，逻辑关系为等于，值为特定的调用服务。
针对除特定调用者之外的调用方：限流粒度选择基于标签限流，设置系统标签为上游服务名，逻辑关系为不等于，值为特定的调用服务。
区分调用方除了使用上游服务名等系统标签外，还可以使用自定义标签来区分带有不同业务信息的调用。例如针对特定用户foo的调用进行限流，可以在代码中设置user参数，然后在限流规则中配置业务标签为user，逻辑关系为等于，值为foo。
Spring Cloud 应用在代码中设置参数可参见 参数传递，Mesh 应用参见 设置自定义标签。
场景2：针对不同的资源进行限流
一个服务包含一个或多个 API，TSF 支持针对服务或者 API 进行限流。在限流规则中，限流粒度字段可以用于区分不同的限流资源，举例如下：
针对当前服务：无须额外设置。
针对特定的API： 限流粒度选择基于标签限流，设置系统标签为当前服务的 API Path，逻辑关系为等于，值为特定的 API Path。如果需要指定 HTTP Method，则需要再增加一条HTTP Method的系统标签来约束。
针对特定API之外的API：限流粒度选择基于标签限流，设置系统标签为当前服务的 API Path，逻辑关系为不等于，值为特定的 API Path。如果需要指定 HTTP Method，则需要再增加一条HTTP Method的系统标签来约束。
操作步骤
要使用限流功能，用户需要在客户端配置依赖项，然后在 TSF 控制台设置限流规则。
步骤1：配置依赖项
对于 Spring Cloud 应用，请参见开发指南中的 服务治理。
对于 Mesh 应用，如果希望使用基于标签的限流，需要在代码中设置标签，参见 设置自定义标签。
步骤2：新建限流规则
前提条件：服务列表上有“在线”状态的微服务。
1. 登录 TSF 控制台。
2. 在左侧导航栏单击 TSF Consul 后，选择服务治理，单击目标服务的“ID”，进入服务详情页。
3. 在页面上方选择服务限流页签，单击新建限流规则。
4. 填写限流规则信息。
规则名：填写规则名称，不超过60个字符。
限流模式：支持单机限流和集群限流两种模式
单机限流：单机限流适合用于给每个服务实例设置兜底保护。
集群限流：集群限流适合用于设置整个服务的流量上限。
限流粒度：支持全局限流和标签限流两种方式。
服务整体限流：不区分限流来源，统计所有请求。单个服务仅支持1条服务整体限流规则。
基于标签限流：根据标签规则设置限流。支持系统标签和自定义标签两种类型，详细说明请参见 系统和自定义标签。
限流阈值：支持按照请求量或者并发线程数限流。
请求数：填写单位时间和请求数，如果单位时间设置为1秒，则限流阈值为QPS。
并发线程数：仅Spring Cloud F G H 2020 1.40之后版本支持。
生效状态：是否立即启用限流规则。
描述：填写描述信息。
限流后返回 HTTP 文本：填写普通文本或者 JSON 格式的 HTTP 返回值。
5. 单击完成，完成限流规则创建，返回服务限流规则列表。
﻿
步骤3：启动限流规则
在限流规则列表中，可以修改规则的生效状态。多条限流规则都是生效状态时，只要服务接收到的请求满足任意一条限流规则，就会触发限流逻辑。 
﻿
步骤4：触发限流
假设服务提供了 /echo API，可以通过不断执行 curl /echo 来模拟限流场景。
示例：在 官网 Demo 中 consumer-demo 服务提供了 /echo-feign/{str} API ，那么针对 consumer-demo 服务新建限流规则，限流粒度为全局限流，单位时间 2 秒，请求数 5 次。启用限流规则。
下载脚本 tsf-ratelimit.sh ，登录可以访问到 consumer-demo 的机器（consumer-demo 所在云服务器也可以），执行 ./tsf-ratelimit.sh <IP>:<Port> ，其中 IP 是 consumer-demo 所在云服务器 IP， Port 为服务监听端口 18083。脚本的作用是每 2 秒触发 10 次调用。由于调用的频率大于限流规则，正常情况下，会收到 HTTP 429 (Too Many Requests) 的状态码。
步骤5：查看限流效果
如果请求数达到了限流阈值，任何到达的请求都会限流模块处理。如果该服务上的配额已经消耗完，会对请求返回 HTTP 429 （Too Many Requests）；否则会正常放行。用户可以在限流规则列表下方的请求数-时间图中查看到被限制的请求数或者被限制请求率-时间图中查看到被限制请求率（计算公式 被限制请求率 = 被限制的请求数 / 请求数）随时间的变化。
﻿
限制说明
等于、不等于、包含、不包含属于严格匹配，正则表达式属于模糊匹配。因此当系统标签是被调方 API PATH 时，目前仅支持使用正则表达式的逻辑关系来匹配带参数的 API 请求。
当标签的逻辑关系是正则表达式，值填写/echo/.*时，可以匹配带参数的请求 /echo/test123 （其中test123是参数）。
当标签的逻辑关系是等于、不等于、包含、不包含关系，值是/echo/{param}时，不能匹配带参数的请求 /echo/test123 （其中 test123 是参数）。
服务限流

本页目录：

场景说明

功能说明

应用场景

场景1：根据调用方进行限流

场景2：针对不同的资源进行限流

操作步骤

步骤1：配置依赖项

步骤2：新建限流规则

步骤3：启动限流规则

步骤4：触发限流

步骤5：查看限流效果

限制说明