## Kong支持两种健康检查 * 主动检查,目标中的特定HTTP端点定期被请求,目标的健康是根据其响应确定的。 * 被动检查(也称为断路器),Kong分析正在访问的流量,并根据它们响应请求确定目标的健康状况。 ## 健康检查的作用 健康检查功能的目标,是动态地将目标标记为健康的或不健康的,对于给定的Kong节点。非集群范围的健康信息同步:每个Kong节点分别决定其目标的健康状况。这是可取的,因为在给定的点上,一个Kong节点可能能够成功地连接到一个目标,而另一个节点却无法到达它:第一个节点将认为它是健康的,而第二个节点将标记为不健康,并开始将流量路由到上游的其他目标。 要么是主动请求(在主动健康检查中),要么是一个被动请求(在被动健康检查中)产生的数据,用来确定一个目标是健康的还是不健康的。请求可能产生TCP错误、超时或产生HTTP状态码。 根据这些信息,健康检查更新了一系列内部计数器: * 如果返回的状态码被配置为“健康”,它将增加目标的“成功”计数器,并清除所有其他计数器; * 如果连接失败,它将增加目标的“TCP故障”计数器,并清除“成功”计数器; * 如果超时,它将增加目标的“超时”计数器,并清除“成功”计数器; * 如果返回的状态码被配置为“不健康”,它将增加目标的“HTTP故障”计数器,并清除“成功”计数器。 如果任何“TCP失败”、“HTTP故障”或“超时”计数器达到它们配置的阈值,那么目标将被标记为不健康。 如果“成功”计数器达到其配置的阈值,目标将被标记为健康。 HTTP状态码的列表是“健康的”或“不健康的”,每个计数器的单独阈值都可以在每个上游的基础上进行配置。下面,我们有一个上游实体的配置示例,展示了用于配置健康检查的各种字段的默认值。管理API参考文档中包含了对每个字段的描述。 ``` { "name": "service.v1.xyz", "healthchecks": { "active": { "concurrency": 10, "healthy": { "http_statuses": [ 200, 302 ], "interval": 0, "successes": 0 }, "http_path": "/", "timeout": 1, "unhealthy": { "http_failures": 0, "http_statuses": [ 429, 404, 500, 501, 502, 503, 504, 505 ], "interval": 0, "tcp_failures": 0, "timeouts": 0 } }, "passive": { "healthy": { "http_statuses": [ 200, 201, 202, 203, 204, 205, 206, 207, 208, 226, 300, 301, 302, 303, 304, 305, 306, 307, 308 ], "successes": 0 }, "unhealthy": { "http_failures": 0, "http_statuses": [ 429, 500, 503 ], "tcp_failures": 0, "timeouts": 0 } } }, "slots": 10 } ``` 如果上游的所有目标都是不健康的,Kong将对上游的请求返回`503服务不可用` 提示: 1、健康检查只在活动目标上运行,并且不修改在Kong数据库中目标的活动状态。 2、不健康的目标不会从负载平衡器中移除,因此在使用散列算法时,不会对平衡器布局产生任何影响(它们只是被跳过)。 3、DNS警告和平衡器警告也适用于健康检查。如果为目标使用主机名,那么请确保DNS服务器总是返回一个名称的完整IP地址集,并且不会限制响应。如果不这样做,可能会导致健康检查没有被执行。 ## 如何配置健康检查呢? [1. 主动健康检查](./4.3.2健康检查.md) [2. 被动健康检查(断路器)](./4.3.3断路器被动检查.md)