TCP是有状态的连接,客户端与服务端进行的是长连接,一旦建立连接,一个客户端发起的请求,必须落在同一台tcp的server上,如何做负载均衡呢?
![](https://img.kancloud.cn/e7/82/e78282215766072bdb65642bfa10ccfa_695x421.png)
![](https://img.kancloud.cn/01/8d/018dc4f1eb626e6960af8fba6c59ea5f_1014x514.png)
缺点: 会存在dns劫持
通过搭建tcp-server集群来保证高可用,客户端来实现负载均衡:
client内配置有tcp1/tcp2/tcp3.daojia.com三个tcp-server的外网IP,客户端通过“随机”的方式选择tcp-server,假设选择到的是tcp1.daojia.com,通过DNS解析tcp1.daojia.com,通过外网IP连接真实的tcp-server
如何保证高可用呢?
如果client发现某个tcp-server连接不上,则选择另一个。
潜在的缺点?
* 每次连接前,需要多实施一次DNS访问
* 难以预防DNS劫持
* 多一次DNS访问意味着更长的连接时间,这个不足在手机端更为明显
如何解决DNS的问题?
直接将IP配置在客户端,可以解决上述两个问题,很多公司也就是这么做的(俗称“IP直通车”)。
“IP直通车”有什么新问题?
* 将IP写死在客户端,在客户端实施负载均衡,扩展性很差:
* 如果原有IP发生变化,客户端得不到实时通知
* 如果新增IP,即tcp-sever扩容,客户端也得不到实时通知
如果负载均衡策略变化,需要升级客户端
只有将复杂的策略下沉到服务端,才能根本上解决扩展性的问题。
增加一个http接口,将客户端的“IP配置”与“均衡策略”放到服务端是一个不错的方案:
client每次访问tcp-server前,先调用一个新增的get-tcp-ip接口,对于client而言,这个http接口只返回一个tcp-server的IP
这个http接口,实现的是原client的IP均衡策略,拿到tcp-server的IP后,和原来一样向tcp-server发起TCP长连接
,这样的话,扩展性问题就解决了:
如果原有IP发生变化,只需要修改get-tcp-ip接口的配置
如果新增IP,也是修改get-tcp-ip接口的配置,如果负载均衡策略变化,需要升级客户端
然而,新的问题又产生了,如果所有IP放在客户端,当有一个IP挂掉的时候,client可以再换一个IP连接,保证可用性,而get-tcp-ip接口只是维护静态的tcp-server集群IP,对于这些IP对应的tcp-server是否可用,是完全不知情的,怎么办呢?
![](https://img.kancloud.cn/de/3d/de3da4e86dd64071fbd9aa914a7481c4_1260x506.png)
![](https://img.kancloud.cn/eb/ad/ebad953eefc9ec5f60e926118ce174cd_908x503.png)