合规国际互联网加速 OSASE为企业客户提供高速稳定SD-WAN国际加速解决方案。 广告
## 25 整体设计:队列设计思想、工作中使用场景 ## 引导语 本章我们学习了 LinkedBlockingQueue、ArrayBlockingQueue、SynchronousQueue、DelayQueue 四种队列,四种队列底层数据结构各不相同,使用场景也不相同,本章我们从设计思想和使用场景两个大的方向做一些对比和总结。 ### 1 设计思想 首先我们画出队列的总体设计图: ![](https://img.kancloud.cn/47/de/47dea6bff57ef395ed737ea795a2c2bc_1255x971.jpg) 从图中我们可以看出几点: 1. 队列解耦了生产者和消费者,提供了生产者和消费者间关系的多种形式,比如 LinkedBlockingQueue、ArrayBlockingQueue 两种队列就把解耦了生产者和消费者,比如 SynchronousQueue 这种就把生产者和消费者相互对应(生产者的消息被消费者开始消费之后,生产者才能返回,为了方便理解,使用相互对应这个词); 2. 不同的队列有着不同的数据结构,有链表(LinkedBlockingQueue)、数组(ArrayBlockingQueue)、堆栈(SynchronousQueue)等; 3. 不同的数据结构,决定了入队和出队的姿势是不同的。 接下来我们分别按照这几个方面来总结分析一下。 #### 1.1 队列的数据结构 链表结构的队列就是 LinkedBlockingQueue,其特征如下: 1. 初始大小默认是 Integer 的最大值,也可以设置初始大小; 2. 链表元素通过 next 属性关联下一个元素; 3. 新增是从链表的尾部新增,拿是从链表头开始拿。 数组结构的队列是 ArrayBlockingQueue,特征如下: 1. 容量大小是固定的,不能动态扩容; 2. 有 takeIndex 和 putIndex 两个索引记录下次拿和新增的位置; 3. 当 takeIndex 和 putIndex 到达数组的最后一个位置时,下次都是从 0 开始循环。 SynchronousQueue 有着两种数据结构,分别是队列和堆栈,特征如下: 1. 队列保证了先入先出的数据结构,体现了公平性; 2. 堆栈是先入后出的数据结构,是不公平的,但性能高于先入先出。 #### 1.2 入队和出队的方式 不同的队列有着不同的数据结构,导致其入队和出队的方式也不同: 1. 链表是入队是直接追加到队尾,出队是从链表头拿数据; 2. 数组是有 takeIndex 和 putIndex 两个索引位置记录下次拿和取的位置,如总体设计图,入队直接指向了 putIndex,出队指向了 takeIndex; 3. 堆栈主要都是围绕栈头进行入栈和出栈的。 #### 1.3 生产者和消费者之间的通信机制 从四种队列我们可以看出来生产者和消费者之间有两种通信机制,一种是强关联,一种是无关联。 强关联主要是指 SynchronousQueue 队列,生产者往队列中 put 数据,如果这时候没有消费者消费的话,生产者就会一直阻塞住,是无法返回的;消费者来队列里取数据,如果这时候队列中没有数据,消费者也会一直阻塞住,所以 SynchronousQueue 队列模型中,生产者和消费者是强关联的,如果只有其中一方存在,只会阻塞,是无法传递数据的。 无关联主要是说有数据存储功能的队列,比如说 LinkedBlockingQueue 和 ArrayBlockingQueue,只要队列容器不满,生产者就能放成功,生产者就可以直接返回,和有无消费者一点关系都没有,生产者和消费者完全解耦,通过队列容器的储存功能进行解耦。 ### 2 工作中的使用场景 在日常工作中,我们需要根据队列的特征来匹配业务场景,从而决定使用哪种队列,我们总结下各个队列适合使用的场景: #### 2.1 LinkedBlockingQueue 适合对生产的数据大小不定(时高时低),数据量较大的场景,比如说我们在淘宝上买东西,点击下单按钮时,对应着后台的系统叫做下单系统,下单系统会把下单请求都放到一个线程池里面,这时候我们初始化线程池时,一般会选择 LinkedBlockingQueue,并且设置一个合适的大小,此时选择 LinkedBlockingQueue 主要原因在于:在不高于我们设定的阈值内,队列里面的大小可大可小,不会有任何性能损耗,正好符合下单流量的特点,时大时小。 一般工作中,我们大多数都会选择 LinkedBlockingQueue 队列,但会设置 LinkedBlockingQueue 的最大容量,如果初始化时直接使用默认的 Integer 的最大值,当流量很大,而消费者处理能力很差时,大量请求都会在队列中堆积,会大量消耗机器的内存,就会降低机器整体性能甚至引起 宕机,一旦宕机,在队列中的数据都会消失,因为队列的数据是保存在内存中的,一旦机器宕机,内存中的数据都会消失的,所以使用 LinkedBlockingQueue 队列时,建议还是要根据日常的流量设置合适的队列的大小。 #### 2.2 ArrayBlockingQueue 一般用于生产数据固定的场景,比如说系统每天会进行对账,对账完成之后,会固定的产生 100 条对账结果,因为对账结果固定,我们就可以使用 ArrayBlockingQueue 队列,大小可以设置成 100。 #### 2.3 DelayQueue 延迟队列,在工作中经常遇到,主要用于任务不想立马执行,想等待一段时间才执行的场景。 比如说延迟对账,我们在工作中曾经遇到过这样的场景:我们在淘宝上买东西,弹出支付宝付款页面,在我们输入指纹的瞬间,流程主要是前端 -》交易后端 -》支付后端,交易后端调用支付后端主要是为了把我们支付宝的钱划给商家,而交易调用支付的过程中,有小概率的情况,因为网络抖动会发生超时的情况,这时候就需要通过及时的对账来解决这个事情(对账只是解决这个 问题的手段之一),我们简单画一个流程图: ![](https://img.kancloud.cn/8e/86/8e86133f53c639567096077cbe8042c7_1184x616.jpg) 这是一个真实场景,为了方便描述,已经大大简化了,再说明几点: 1. 交易调用支付的接口,这个接口的作用就是为了把小美的 800 元转给商家小明; 2. 接口调用超时,此时交易系统并不知道 800 有没有成功转给小明,当然想知道的方式有很多,我们选择了对账的方式,对账的目的就是为了知道当前 800 元有没有成功转给小明; 3. 延迟对账的目的,因为支付系统把 800 元转给商家小明也是需要时间的,如果超时之后立马对账,可能转账的动作还在进行中,导致对账的结果不准确,所以需要延迟几秒后再去对账; 4. 对账之后的结果有几种,比如已经成功的把 800 元转给小明了,这时候需要把对账结果告诉交易系统,交易系统更新数据,前端就能够显示转账成功了。 在这个案列中,延迟对账的核心技术就是 DelayQueue,我们大概这么做的:新建对账任务,设置 3 秒之后执行,把任务放到 DelayQueue 中,过了 3 秒之后,就会自动执行对账任务了。 DelayQueue 延迟执行的功能就在这个场景中得到应用。 #### 3 总结 我们不会为了阅读源码而读源码,我们读源码的最初目的,是为了提高我们的技术深度,最终目的是为了在不同的场景中,能够选择合适的技术进行落地,本章中解释的一些队列的场景,我们在工作中其实都会遇到,特别是在使用线程池时,使用哪种队列是我们必须思考的一个问题,所以本章先比较了各个队列的适合使用场景,然后举了几个案列进行具体分析,希望大家也能把技术具体落地到实际工作中,使技术推动、辅助业务。