多应用+插件架构,代码干净,二开方便,首家独创一键云编译技术,文档视频完善,免费商用码云13.8K 广告
## Jobs和Instances(任务和实例) --- 就Prometheus而言,pull拉取采样点的端点服务称之为**instance**。多个这样pull拉取采样点的instance, 则构成了一个**job** 例如, 一个被称作**api-server**的任务有四个相同的实例。 - job: `api-server` - instance 1:`1.2.3.4:5670` - instance 2:`1.2.3.4:5671` - instance 3:`5.6.7.8:5670` - instance 4:`5.6.7.8:5671` ### 自动化生成的标签和时间序列 当Prometheus拉取一个目标, 会自动地把两个标签添加到度量名称的标签列表中,分别是: - **job**: 目标所属的配置任务名称**api-server**。 - **instance**: 采样点所在服务: `host:port` 如果以上两个标签二者之一存在于采样点中,这个取决于`honor_labels`配置选项。详见[文档](https://prometheus.io/docs/operating/configuration/#%3Cscrape_config%3E) 对于每个采样点所在服务instance,Prometheus都会存储以下的度量指标采样点: - `up{job="[job-name]", instance="instance-id"}`: up值=1,表示采样点所在服务健康; 否则,网络不通, 或者服务挂掉了 - `scrape_duration_seconds{job="[job-name]", instance="[instance-id]"}`: 尝试获取目前采样点的时间开销 - `scrape_samples_post_metric_relabeling{job="<job-name>", instance="<instance-id>"}`: 表示度量指标的标签变化后,标签没有变化的度量指标数量。 - `scrape_samples_scraped{job="<job-name>", instance="<instance-id>"}`: 这个采样点目标暴露的样本点数量 备注:我查了下`scrape_samples_post_metric_relabeling` 和 `scrape_samples_scraped`的值好像是一样的。还是这两个值没有理解 `up`度量指标对服务健康的监控是非常有用的。