[TOC]
## 问题描述/背景
业务跑在容器环境,升级docker和runc后,发现浏览器访问业务异常。
业务属于前后端分离的,即前端会发起请求后端。前端在 172.20.x.x 主机上,业务后端在 172.17.x.x 。网络是通过三层网络转发。
## 问题排查
1. 查看业务日志,是否正常 --> 未发现异常情况
2. 在容器和所在宿主机上curl业务的接口 --> 正常返回信息
3. 前端主机curl业务接口 --> curl异常
- 前端主机 `telnet 业务IP地址 业务端口号` ,不通
4. harbor主机tcpdump抓包分析, 发现harbor主机有收到请求,但是没有回复
![](https://img.kancloud.cn/70/b1/70b14de8bf7ec1adbb899e32d4e80bab_1530x676.png)
5. 收到包但是没有回复,大概率是 **没有回包通路导致的** 。查看路由信息发现有条包含前端的路由且下一跳是桥接网卡。怀疑是docker生成的网络设备
![](https://img.kancloud.cn/09/bd/09bdf9f142ad7458561ac52ad2c3db4c_1039x230.png)
6. 查看docker的桥接网卡情况 `sudo docker network ls` ,果真其中一个网桥id为 `56e678a34b55` 对应上面路由信息网卡名称为 `br-56e678a34b55` 一致。
7. 查看详细的网桥信息`sudo docker network inspect 56e678a34b55`,再次验证`route -n`查看IP段是否与网络是一致的。 --> 是一致的,原因就是harbor生成的
## 解决方法
解决思路:将 `harbor` 的桥接网卡固定上某个IP段,就不会出现IP段冲突的问题。
```yaml
networks:
harbor:
external: false
ipam:
driver: default
config:
- subnet: "172.16.0.0/24"
```
>[info] 这里使用演示network下的一个网络。如果有多个网络的话,都限制下就好了。
>[warning] `subnet` 不要以现有的规划IP段冲突,否则后续还是有问题的。
- 前言
- 架构
- 部署
- kubeadm部署
- kubeadm扩容节点
- 二进制安装基础组件
- 添加master节点
- 添加工作节点
- 选装插件安装
- Kubernetes使用
- k8s与dockerfile启动参数
- hostPort与hostNetwork异同
- 应用上下线最佳实践
- 进入容器命名空间
- 主机与pod之间拷贝
- events排序问题
- k8s会话保持
- 容器root特权
- CNI插件
- calico
- calicoctl安装
- calico网络通信
- calico更改pod地址范围
- 新增节点网卡名不一致
- 修改calico模式
- calico数据存储迁移
- 启用 kubectl 来管理 Calico
- calico卸载
- cilium
- cilium架构
- cilium/hubble安装
- cilium网络路由
- IP地址管理(IPAM)
- Cilium替换KubeProxy
- NodePort运行DSR模式
- IP地址伪装
- ingress使用
- nginx-ingress
- ingress安装
- ingress高可用
- helm方式安装
- 基本使用
- Rewrite配置
- tls安全路由
- ingress发布管理
- 代理k8s集群外的web应用
- ingress自定义日志
- ingress记录真实IP地址
- 自定义参数
- traefik-ingress
- traefik名词概念
- traefik安装
- traefik初次使用
- traefik路由(IngressRoute)
- traefik中间件(middlewares)
- traefik记录真实IP地址
- cert-manager
- 安装教程
- 颁布者CA
- 创建证书
- 外部存储
- 对接NFS
- 对接ceph-rbd
- 对接cephfs
- 监控平台
- Prometheus
- Prometheus安装
- grafana安装
- Prometheus配置文件
- node_exporter安装
- kube-state-metrics安装
- Prometheus黑盒监控
- Prometheus告警
- grafana仪表盘设置
- 常用监控配置文件
- thanos
- Prometheus
- Sidecar组件
- Store Gateway组件
- Querier组件
- Compactor组件
- Prometheus监控项
- grafana
- Querier对接grafana
- alertmanager
- Prometheus对接alertmanager
- 日志中心
- filebeat安装
- kafka安装
- logstash安装
- elasticsearch安装
- elasticsearch索引生命周期管理
- kibana安装
- event事件收集
- 资源预留
- 节点资源预留
- imagefs与nodefs验证
- 资源预留 vs 驱逐 vs OOM
- scheduler调度原理
- Helm
- Helm安装
- Helm基本使用
- 安全
- apiserver审计日志
- RBAC鉴权
- namespace资源限制
- 加密Secret数据
- 服务网格
- 备份恢复
- Velero安装
- 备份与恢复
- 常用维护操作
- container runtime
- 拉取私有仓库镜像配置
- 拉取公网镜像加速配置
- runtime网络代理
- overlay2目录占用过大
- 更改Docker的数据目录
- Harbor
- 重置Harbor密码
- 问题处理
- 关闭或开启Harbor的认证
- 固定harbor的IP地址范围
- ETCD
- ETCD扩缩容
- ETCD常用命令
- ETCD数据空间压缩清理
- ingress
- ingress-nginx header配置
- kubernetes
- 验证yaml合法性
- 切换KubeProxy模式
- 容器解析域名
- 删除节点
- 修改镜像仓库
- 修改node名称
- 升级k8s集群
- 切换容器运行时
- apiserver接口
- 其他
- 升级内核
- k8s组件性能分析
- ETCD
- calico
- calico健康检查失败
- Harbor
- harbor同步失败
- Kubernetes
- 资源Terminating状态
- 启动容器报错