[TOC]
安装好grafana并不能直接看到监控数据,需要自行设置dashboard或plugins。
展示 `kubernetes`、`ingress-nginx-controller` 和 `etcd` 三个组件的漂亮的仪表盘。
## kubernetes
这个使用的是现成的插件(devopsprodigy-kubegraf-app),不需要写dashboard文件内容。只需要导入证书和填写服务器信息即可。
> 要求:
> 1. Grafana > 5.0.0
> 2. Prometheus + node-exporter + kube-state-metrics (version >= 1.4.0)
> 3. Grafana-piechart-panel
1. 安装插件
- **在线安装**
登录容器,下载插件
grafana-cli plugins install devopsprodigy-kubegraf-app
- **离线安装**
在grafana的主机,找到数据目录($PATH/plugins)
kubectl -n kube-mon cp grafana-piechart-panel/ grafana-6dcb54fd8d-2zw9f:/var/lib/grafana/plugins/
kubectl -n kube-mon cp devopsprodigy-kubegraf-app grafana-6dcb54fd8d-2zw9f:/var/lib/grafana/plugins/
> 上面两种方法安装,都是需要重启grafana容器的。
> kubectl -n kube-mon delete pod -l app=grafana
2. 配置插件
Ⅰ 配置数据源
![](https://img.kancloud.cn/b5/22/b522083056aa53b01fb0c6e092a5d2c3_1299x553.png)
![](https://img.kancloud.cn/d3/af/d3af3fa6217bd2ea4c60ec7873cac7af_1190x455.png)
![](https://img.kancloud.cn/c6/aa/c6aa89b6ce02f3a83449e9402131639f_1234x628.png)
![](https://img.kancloud.cn/ad/f6/adf656973646d31a82414895351c5d4a_1300x789.png)
> 注意:如果promtheus有添加上下文的话,URL也需要添加上对应的上下文。
Ⅱ 启动插件
![](https://img.kancloud.cn/a7/2c/a72c3474dcdfc57a4ae80b0cd672947a_1299x712.png)
![](https://img.kancloud.cn/7d/77/7d771658fceddaecee904beeced18144_1301x724.png)
![](https://img.kancloud.cn/c2/5f/c25f3303c98a846b11851db04a4f9714_976x607.png)
Ⅲ 配置插件
![](https://img.kancloud.cn/a0/18/a018d66f1f4e3f919ba21a550565d854_1253x668.png)
![](https://img.kancloud.cn/de/d8/ded886595afbf46ba5cdf2bc27004d3b_1283x405.png)
![](https://img.kancloud.cn/cc/9a/cc9a8f14ea16ca91ec9c976134e39d91_1289x554.png)
![](https://img.kancloud.cn/36/0f/360fd95f05a6707b15ab27b5ae12d77d_1215x823.png)
![](https://img.kancloud.cn/8e/53/8e5319a03373f5e2bd0d1324ad3fab1d_1208x575.png)
> 获取上面的数据的方法:
> #URL框
> cat /root/.kube/config | grep server | awk '{print $2}'
> #CA Cert框
> cat /root/.kube/config | grep certificate-authority-data | awk '{print $2}' | base64 -d
> #Client Cert框
> cat /root/.kube/config | grep client-certificate-data | awk '{print $2}' | base64 -d
> #Client Key框
> cat /root/.kube/config | grep client-key-data | awk '{print $2}' | base64 -d
保存完后,会跳转到配置插件页面。如果没有出现配置好的集群信息的话,重新刷新一下即可。
Ⅳ 查看仪表盘
![](https://img.kancloud.cn/1d/ef/1defe553752eb889c61eb2fbceffb219_1920x652.png)
![](https://img.kancloud.cn/84/d5/84d5a42d0858eb5e1ea88d7e82e7607d_1854x699.png)
![](https://img.kancloud.cn/fa/06/fa06ce120aa92301608557b7f3c9fe4c_1920x935.png)
## ingress-nginx-controller
1. 下载官方提供的dashboard文件
下载地址:https://raw.githubusercontent.com/kubernetes/ingress-nginx/main/deploy/grafana/dashboards/nginx.json
2. 导入dashboard文件
![](https://img.kancloud.cn/fc/88/fc888deab9fca8c11e250e7f658e12b5_1920x690.png)
![](https://img.kancloud.cn/3d/cb/3dcb4d1e1fd7f53974685deff9c97b27_1439x829.png)
![](https://img.kancloud.cn/74/85/74854b244a9ae8df2cd8e9cbe4507bde_1297x757.png)
3. 验证
![](https://img.kancloud.cn/e5/af/e5af69fa22e7e06fdf794b0edce00615_1840x878.png)
## etcd
etcd官网也提供有dashboard文件,不过文件好像有些问题。不能够直接导入,这里提供一个修改好的文件。请查看附件的章节。
导入方法与 ingress-nginx-controller 的方法一致,这里就不赘述。
## minio
参考文章:https://docs.min.io/docs/how-to-monitor-minio-using-prometheus.html
1. 将新主机添加到配置文件
```shell
$ mc config host add monitor http://192.168.31.199:9000 admin ak+JLouROYaP
Added `monitor` successfully.
```
2. 查看是否添加成功
```shell
$ mc config host list monitor
monitor
URL : http://192.168.31.199:9000
AccessKey : admin
SecretKey : ak+JLouROYaP
API : s3v4
Path : auto
```
3. 该命令将生成 prometheus.yml 的 scrape_configs 部分
```shell
$ mc admin prometheus generate monitor
scrape_configs:
- job_name: minio-job
bearer_token: eyJhbGciOiJIUzUxMiIsInR5cCI6IkpXVCJ9.eyJleHAiOjQ4MDkwNDgyNDksImlzcyI6InByb21ldGhldXMiLCJzdWIiOiJhZG1pbiJ9.oX7aSpbySO8LtHm3PwPQAB1EnHCTfwNY3_LH7B1-YYArCOlbd_4SUY0l2SMIW7_SjpAr_5x3qqEhHNvwOBThuQ
metrics_path: /minio/v2/metrics/cluster
scheme: http
static_configs:
- targets: ['192.168.31.199:9000']
```
> 注意:如果是https协议的话,需要添加取消证书验证。
4. Prometheus配置添加上面信息
![](https://img.kancloud.cn/2b/23/2b2320efd0842bc8707d657695451434_1800x176.png)
> 重启加载Prometheus配置文件 `curl -X POST "http://`kubectl -n kube-mon get endpoints prometheus -o jsonpath={.subsets[0].addresses[0].ip}`:9090/prometheus/-/reload"`
5. 验证
![](https://img.kancloud.cn/bd/f2/bdf27efdbb9b5f6c00ea7b6c467499b0_1829x206.png)
6. 添加dashboard
![](https://img.kancloud.cn/e0/9d/e09d03ad5beff54bcf760c29bb9e848e_1633x845.png)
![](https://img.kancloud.cn/7d/05/7d0581eb3d8732119808689332bffcea_1745x856.png)
> 上图就是有两个相同的数据字,提供的json文件有些瑕疵。这里提供一个修改好的文件。请查看附件的章节。
## ceph
参考文章:https://docs.ceph.com/en/nautilus/mgr/prometheus/
1. 开通ceph mgr模块的Prometheus
```shell
$ ceph mgr module enable prometheus
```
> 注意:报错提示 `Error ENOENT: module 'prometheus' reports that it cannot run on the active manager daemon: No module named 'cherrypy' (pass --force to force enablement)`。需要安装一下cherrypy模块 `sudo pip3 install cherrypy` 安装即可
2. 验证是否开启成功
```shell
$ ceph mgr module ls | grep -A5 enabled_modules
"enabled_modules": [
"iostat",
"prometheus",
"restful"
],
```
3. 设置Prometheus暴露地址和端口
```shell
$ ceph config set mgr mgr/prometheus/server_addr 0.0.0.0
$ ceph config set mgr mgr/prometheus/server_port 9283
```
4. 验证设置
```shell
## ceph config get mgr.主机名
$ ceph config get mgr.ceph02
WHO MASK LEVEL OPTION VALUE RO
mgr advanced mgr/prometheus/server_addr 0.0.0.0 *
mgr advanced mgr/prometheus/server_port 9283 *
$ ceph mgr services
{
"prometheus": "http://ceph01.ecloud.com:9283/"
}
```
5. Prometheus配置段
```yaml
- job_name: "Ceph"
static_configs:
- targets:
# 所有mgr主机
- 192.168.31.132:9283
- 192.168.31.69:9283
- 192.168.31.177:9283
labels:
cluster: production
```
6. 验证Prometheus的target
![](https://img.kancloud.cn/c0/06/c0062ce2feaec0dac3049c4b162720e8_1818x218.png)
7. grafana安装dashboard
![](https://img.kancloud.cn/95/c9/95c9e119f7cc7084de20920c5221fedd_1189x764.png)
> 使用 `2842` 的dashboard页面
8. 验证dashboard
![](https://img.kancloud.cn/47/00/4700871321a404b598ff3271fa04e29b_1753x863.png)
## 参考文档
https://grafana.com/grafana/plugins/devopsprodigy-kubegraf-app/
https://kubernetes.github.io/ingress-nginx/user-guide/monitoring/#grafana
https://etcd.io/docs/v3.4/op-guide/monitoring/#grafana
## 附件文件
所需的dashboard和plugins文件都放在百度网盘上
> 链接:https://pan.baidu.com/s/1bxnNl05F97Il7pZ0sgdRuQ
> 提取码:05eh
- 前言
- 架构
- 部署
- kubeadm部署
- kubeadm扩容节点
- 二进制安装基础组件
- 添加master节点
- 添加工作节点
- 选装插件安装
- Kubernetes使用
- k8s与dockerfile启动参数
- hostPort与hostNetwork异同
- 应用上下线最佳实践
- 进入容器命名空间
- 主机与pod之间拷贝
- events排序问题
- k8s会话保持
- 容器root特权
- CNI插件
- calico
- calicoctl安装
- calico网络通信
- calico更改pod地址范围
- 新增节点网卡名不一致
- 修改calico模式
- calico数据存储迁移
- 启用 kubectl 来管理 Calico
- calico卸载
- cilium
- cilium架构
- cilium/hubble安装
- cilium网络路由
- IP地址管理(IPAM)
- Cilium替换KubeProxy
- NodePort运行DSR模式
- IP地址伪装
- ingress使用
- nginx-ingress
- ingress安装
- ingress高可用
- helm方式安装
- 基本使用
- Rewrite配置
- tls安全路由
- ingress发布管理
- 代理k8s集群外的web应用
- ingress自定义日志
- ingress记录真实IP地址
- 自定义参数
- traefik-ingress
- traefik名词概念
- traefik安装
- traefik初次使用
- traefik路由(IngressRoute)
- traefik中间件(middlewares)
- traefik记录真实IP地址
- cert-manager
- 安装教程
- 颁布者CA
- 创建证书
- 外部存储
- 对接NFS
- 对接ceph-rbd
- 对接cephfs
- 监控平台
- Prometheus
- Prometheus安装
- grafana安装
- Prometheus配置文件
- node_exporter安装
- kube-state-metrics安装
- Prometheus黑盒监控
- Prometheus告警
- grafana仪表盘设置
- 常用监控配置文件
- thanos
- Prometheus
- Sidecar组件
- Store Gateway组件
- Querier组件
- Compactor组件
- Prometheus监控项
- grafana
- Querier对接grafana
- alertmanager
- Prometheus对接alertmanager
- 日志中心
- filebeat安装
- kafka安装
- logstash安装
- elasticsearch安装
- elasticsearch索引生命周期管理
- kibana安装
- event事件收集
- 资源预留
- 节点资源预留
- imagefs与nodefs验证
- 资源预留 vs 驱逐 vs OOM
- scheduler调度原理
- Helm
- Helm安装
- Helm基本使用
- 安全
- apiserver审计日志
- RBAC鉴权
- namespace资源限制
- 加密Secret数据
- 服务网格
- 备份恢复
- Velero安装
- 备份与恢复
- 常用维护操作
- container runtime
- 拉取私有仓库镜像配置
- 拉取公网镜像加速配置
- runtime网络代理
- overlay2目录占用过大
- 更改Docker的数据目录
- Harbor
- 重置Harbor密码
- 问题处理
- 关闭或开启Harbor的认证
- 固定harbor的IP地址范围
- ETCD
- ETCD扩缩容
- ETCD常用命令
- ETCD数据空间压缩清理
- ingress
- ingress-nginx header配置
- kubernetes
- 验证yaml合法性
- 切换KubeProxy模式
- 容器解析域名
- 删除节点
- 修改镜像仓库
- 修改node名称
- 升级k8s集群
- 切换容器运行时
- apiserver接口
- 其他
- 升级内核
- k8s组件性能分析
- ETCD
- calico
- calico健康检查失败
- Harbor
- harbor同步失败
- Kubernetes
- 资源Terminating状态
- 启动容器报错