### 异常检测
异常值检测和逐出是动态确定上游群集中,某些主机是否正在执行不同于其他主机的过程,并将其从正常负载平衡集中移除。 性能可能会受到不同程度的影响,例如连续的故障,时间成功率,时间延迟等。异常检测是被动健康检查的一种形式。 Envoy还支持主动健康检查。被动和主动健康检查可以一起使用或独立使用,形成整体上游健康检查解决方案的基础。
#### 逐出算法
取决于异常值检测的类型,弹出或者以行内(例如在连续5xx的情况下)或以指定的间隔(例如在定期成功率的情况下)运行。逐出算法的工作原理如下:
1. 主机被确定为异常。
2. Envoy检查以确保逐出的主机数量低于允许的阈值(通过`outlier_detection.max_ejection_percent`设置指定)。如果逐出的主机数量超过阈值,主机不会被逐出。
3. 主机被逐出几毫秒。意味着主机被标记为不健康,在负载平衡期间不会使用,除非负载平衡器处于紧急情况。毫秒数等于`outlier_detection.base_ejection_time_ms`值乘以主机被逐出的次数。这会导致主机如果继续失败,则会被逐出更长和更长的时间。
4. 逐出的主机将在逐出时间满之后自动重新投入使用。一般而言,异常值检测与主动健康检查一起使用,用于全面的健康检查解决方案。
### 检测类型
Envoy支持以下异常检测类型:
#### 连续5xx
如果上游主机返回一些连续的5xx,它将被逐出。请注意,在这种情况下,5xx意味着一个实际的5xx响应代码,或者一个会导致HTTP路由器代表上游返回的事件(复位,连接失败等)。逐出所需的连续5xx数量由`outlier_detection.consecutive_5xx`值控制。
#### 连续的网关故障
如果上游主机返回一些连续的“网关错误”(502,503或504状态码),它将被逐出。请注意,这包括HTTP路由代表上游返回其中一个状态码的事件(重置,连接失败等)。逐出所需的连续网关故障的数量由`outlier_detection.consecutive_gateway_failure`值控制。
#### 成功率
基于成功率的异常值逐出汇总来自群集中每个主机的成功率数据。然后以给定的时间间隔,基于统计异常值检测来逐出主机。如果主机在一个时间间隔内的,请求量小于`outlier_detection.success_rate_request_volume`值,则不会为认为该主机成功率异常值。此外,如果一个时间间隔内请求量最小的主机,请求数小于`outlier_detection.success_rate_minimum_hosts`值,则不会对群集执行检测。
#### 逐出事件记录
Envoy可以选择生成异常值逐出事件日志。这在日常操作中非常有用,因为全局统计数据,不能提供有关哪些主机被逐出的信息以及原因。下面是一条JSON格式的日志记录:
```
{
"time": "...",
"secs_since_last_action": "...",
"cluster": "...",
"upstream_url": "...",
"action": "...",
"type": "...",
"num_ejections": "...",
"enforced": "...",
"host_success_rate": "...",
"cluster_success_rate_average": "...",
"cluster_success_rate_ejection_threshold": "..."
}
```
**time**:
事件发生的时间。
**secs_since_last_action**:
自从上一次操作(逐出或未逐出)发生以来的时间,以秒为单位。如果是第一次,之前没有动作,该值将为-1。
**cluster**:
被逐出主机所在的群集。
**upstream_url**:
被逐出的主机URL。例如,`tcp://1.2.3.4:80`。
**action**:
触发的动作(`eject`/`uneject`)
**type**:
如果`action`是`eject`,这里描述的是`eject类型`;如`5xx`、`GatewayFailure`、`SuccessRate`。
**num_ejections**:
如果`action`是`eject`,指定主机被逐出的累计次数(对于Envoy而言是本地的,并且如果主机被重新添加到集群,那么这个数值会被重置)
**enforced**:
如果`action`是`eject`,指定逐出是否被强制执行。`true`表示主机被强制逐出。`false`表示着事件被记录了,但是主机并没有被逐出。
**host_success_rate**:
如果`action`是`eject`,并且`type`是`SuccessRate`,主机在被逐出时的成功率(0~100范围)。
**cluster_success_rate_average**:
如果`action`是`eject`,并且`type`是`SuccessRate`,主机在被逐出时所在的集群平均成功率(0~100范围)。
**cluster_success_rate_ejection_threshold**:
如果`action`是`eject`,并且`type`是`SuccessRate`,指定逐出事件的成功率阈值。
### 配置参考
- [集群管理全局配置](../../v1APIreference/Clustermanager/Outlierdetection.md)
- [每个群集配置](../../v1APIreference/Clustermanager/Cluster/Outlierdetection.md)
- [运行时设置](../../Configurationreference/Clustermanager/Runtime.md)
- [统计参考](../../Configurationreference/Clustermanager/Statistics.md)
### 返回
- [架构介绍](../Architectureoverview.md)
- [简介](../../Introduction.md)
- [首页目录](../../README.md)
- 首页
- 简介
- Envoy是什么
- 架构介绍
- 术语
- 线程模型
- 监听器
- L3/L4网络过滤器
- HTTP连接管理
- HTTP过滤器
- HTTP路由
- gRPC
- WebSocket支持
- 集群管理
- 服务发现
- 健康检查
- 连接池
- 负载均衡
- 异常检测
- 熔断
- 全局限速
- TLS
- 统计
- 运行时配置
- 跟踪
- TCP代理
- 访问日志
- MongoDB
- DynamoDB
- Redis
- 热重启
- 动态配置
- 初始化
- 逐出
- 脚本
- 部署
- 业界对比
- 获得帮助
- 历史版本
- 编译安装
- 编译
- 参考配置
- 演示沙箱
- 前端代理
- Zipkin跟踪
- Jaeger跟踪
- gRPC桥接
- 构建Envoy Docker镜像
- 工具
- 配置参考
- V1 API 概述
- V2 API 概述
- 监听器
- 网络过滤器
- TLS客户端身份认证
- Echo
- Mongo代理
- 速率限制
- Redis代理
- TCP代理
- HTTP连接管理器
- 路由匹配
- 流量转移/分流
- HTTP头部操作
- HTTP头部清理
- 统计
- 运行时设置
- 路由发现服务
- HTTP过滤器
- 缓存
- CORS过滤器
- 故障注入
- DynamoDB
- gRPC HTTP/1.1 桥接
- gRPC-JSON 转码过滤器
- gRPC-Web 过滤器
- 健康检查
- 速率限制
- 路由
- Lua
- 集群管理
- 统计
- 运行时设置
- 集群发现服务
- 健康检查
- 熔断
- 访问日志
- 限速服务
- 运行时配置
- 路由表检查工具
- 运维管理
- 命令行选项
- 热重启
- 管理接口
- 统计概述
- 运行时配置
- 文件系统
- 自定义扩展示例
- V1 API参考
- 监听器
- 网络过滤器
- TLS客户端身份认证
- Echo
- HTTP连接管理
- Mongo代理
- 速率限制
- Redis代理
- TCP代理
- HTTP路由配置
- 虚拟主机
- 路由
- 虚拟集群
- 速率限制配置
- 路由发现服务
- HTTP过滤器
- 缓存
- CORS过滤器
- DynamoDB
- 故障注入
- gRPC HTTP/1.1 桥接
- gRPC-JSON 转码过滤器
- gRPC-Web 过滤器
- 健康检查
- Lua
- 速率限制
- 路由
- 集群管理
- 集群
- 健康检查
- 熔断
- TLS上下文
- 异常值检测
- HASH环负载均衡配置
- 异常检测
- 集群发现服务
- 服务发现服务
- 访问日志
- 管理接口
- 限速服务
- 运行时配置
- 跟踪
- V2 API参考
- 启动引导
- 监听&监听发现
- 集群&集群发现
- 服务发现
- 健康检查
- HTTP路由管理&发现
- TLS配置
- 通用的类型
- 网络地址
- 协议选项
- 发现API
- 限速组件
- 过滤器
- 网络过滤器
- TLS客户端身份认证
- HTTP连接管理
- Mongo代理
- 速率限制
- Redis代理
- TCP代理
- HTTP过滤器
- 缓存
- 故障注入
- 健康检查
- Lua
- 速率限制
- 路由
- gRPC-JSON转码器
- 常见访问日志类型
- 常见故障注入类型
- FAQ
- Envoy有多快?
- 我在哪里获得二进制文件?
- 我如何设置SNI?
- 如何设置区域感知路由?
- 我如何设置Zipkin跟踪?