企业🤖AI Agent构建引擎,智能编排和调试,一键部署,支持私有化部署方案 广告
## 19 LinkedBlockingQueue 源码解析 ## 引导语 说到队列,大家的反应可能是我从来都没有用过,应该是不重要的 API 吧。如果这么想,那就大错特错了,我们平时使用到的线程池、读写锁、消息队列等等技术和框架,底层原理都是队列,所以我们万万不可轻视队列,队列是很多高级 API 的基础,学好队列,对自己深入 Java 学习非常重要。 本文主要以 LinkedBlockingQueue 队列为例,详细描述一下底层具体的实现。 ### 1 整体架构 LinkedBlockingQueue 中文叫做链表阻塞队列,这个命名很好,从命名上就知道其底层数据结构是链表,并且队列是可阻塞的。接下来,我们就从整体结构上看看 LinkedBlockingQueue。 #### 1.1 类图 首先我们来看下 LinkedBlockingQueue 类图,如下: ![](https://img.kancloud.cn/e9/93/e993e449203a895b43ee3c633092e3f2_1074x736.jpg) 从类图中,我们大概可以看出两条路径: 1. AbstractQueue -> AbstractCollection -> Collection ->Iterable 这条路径依赖,主要是想复用 Collection 和 迭代器的一些操作,这些我们在说集合的时候,都知道这些类是干什么,能干什么,就不细说了; 2. BlockingQueue -> Queue -> Collection,BlockingQueue 和 Queue 是新出来的两个接口,我们重点说一下。 Queue 是最基础的接口,几乎所有的队列实现类都会实现这个接口,该接口定义出了队列的三大类操作: 新增操作: 1. add 队列满的时候抛出异常; 2. offer 队列满的时候返回 false。 查看并删除操作: 1. remove 队列空的时候抛异常; 2. poll 队列空的时候返回 null。 只查看不删除操作: 1. element 队列空的时候抛异常; 2. peek 队列空的时候返回 null。 一共 6 种方法,除了以上分类方法,也可以分成两类: 1. 遇到队列满或空的时候,抛异常,如 add、remove、element; 2. 遇到队列满或空的时候,返回特殊值,如 offer、poll、peek。 实际上,这些都比较难记忆。每次需要使用的时候,我都会看会源码,才能想起这个方法是抛异常还是返回特殊值。 BlockingQueue 在 Queue 的基础上加上了阻塞的概念,比如一直阻塞,还是阻塞一段时间。为了方便记忆,我们画一个表格,如下: | | |特殊值|一直阻塞|阻塞一段时间| | --- | --- | --- | --- | --- | |新增操作–队列满|add|offer返回false|put|offer过超时时间返回false| |查看并删除操作–队列空 |remove|poll 返回 null|take|阻塞一段时间| |只查看不删除操作–队列空 |element|peek 返回 null|暂无|暂无| PS: remove 方法,BlockingQueue 类注释中定义的是抛异常,但 LinkedBlockingQueue 中 remove 方法实际是返回 false。 从表格中可以看到,在新增和查看并删除两大类操作上,BlockingQueue 增加了阻塞的功能,而且可以选择一直阻塞,或者阻塞一段时间后,返回特殊值。 #### 1.2 类注释 我们看看从 LinkedBlockingQueue 的类注释中能得到那些信息: 1. 基于链表的阻塞队列,其底层的数据结构是链表; 2. 链表维护先入先出队列,新元素被放在队尾,获取元素从队头部拿; 3. 链表大小在初始化的时候可以设置,默认是 Integer 的最大值; 4. 可以使用 Collection 和 Iterator 两个接口的所有操作,因为实现了两者的接口。 #### 1.3 内部构成 LinkedBlockingQueue 内部构成简单来说,分成三个部分:链表存储 + 锁 + 迭代器,我们来看下源码。 ``` // 链表结构 begin //链表的元素 static class Node<E> { E item; //当前元素的下一个,为空表示当前节点是最后一个 Node<E> next; Node(E x) { item = x; } } //链表的容量,默认 Integer.MAX_VALUE private final int capacity; //链表已有元素大小,使用 AtomicInteger,所以是线程安全的 private final AtomicInteger count = new AtomicInteger(); //链表头 transient Node<E> head; //链表尾 private transient Node<E> last; // 链表结构 end // 锁 begin //take 时的锁 private final ReentrantLock takeLock = new ReentrantLock(); // take 的条件队列,condition 可以简单理解为基于 ASQ 同步机制建立的条件队列 private final Condition notEmpty = takeLock.newCondition(); // put 时的锁,设计两把锁的目的,主要为了 take 和 put 可以同时进行 private final ReentrantLock putLock = new ReentrantLock(); // put 的条件队列 private final Condition notFull = putLock.newCondition(); // 锁 end // 迭代器 // 实现了自己的迭代器 private class Itr implements Iterator<E> { ……………… } ``` 从代码上来看,结构是非常清晰的,三种结构各司其职: 1. 链表的作用是为了保存当前节点,节点中的数据可以是任意东西,是一个泛型,比如说队列被应用到线程池时,节点就是线程,比如队列被应用到消息队列中,节点就是消息,节点的含义主要看队列被使用的场景; 2. 锁有 take 锁和 put 锁,是为了保证队列操作时的线程安全,设计两种锁,是为了 take 和 put 两种操作可以同时进行,互不影响。 #### 1.4 初始化 初始化有三种方式: 1. 指定链表容量大小; 2. 不指定链表容量大小,默认是 Integer 的最大值; 3. 对已有集合数据进行初始化。 源码如下: ``` // 不指定容量,默认 Integer 的最大值 public LinkedBlockingQueue() { this(Integer.MAX_VALUE); } // 指定链表容量大小,链表头尾相等,节点值(item)都是 null public LinkedBlockingQueue(int capacity) { if (capacity <= 0) throw new IllegalArgumentException(); this.capacity = capacity; last = head = new Node<E>(null); } // 已有集合数据进行初始化 public LinkedBlockingQueue(Collection<? extends E> c) { this(Integer.MAX_VALUE); final ReentrantLock putLock = this.putLock; putLock.lock(); // Never contended, but necessary for visibility try { int n = 0; for (E e : c) { // 集合内的元素不能为空 if (e == null) throw new NullPointerException(); // capacity 代表链表的大小,在这里是 Integer 的最大值 // 如果集合类的大小大于 Integer 的最大值,就会报错 // 其实这个判断完全可以放在 for 循环外面,这样可以减少 Integer 的最大值次循环(最坏情况) if (n == capacity) throw new IllegalStateException("Queue full"); enqueue(new Node<E>(e)); ++n; } count.set(n); } finally { putLock.unlock(); } } ``` 对于初始化源码,我们说明两点: 1. 初始化时,容量大小是不会影响性能的,只影响在后面的使用,因为初始化队列太小,容易导致没有放多少就会报队列已满的错误; 2. 在对给定集合数据进行初始化时,源码给了一个不优雅的示范,我们不反对在每次 for 循环的时候,都去检查当前链表的大小是否超过容量,但我们希望在 for 循环开始之前就做一步这样的工作。举个列子,给定集合大小是 1 w,链表大小是 9k,按照现在代码实现,只能在 for 循环 9k 次时才能发现,原来给定集合的大小已经大于链表大小了,导致 9k 次循环都是在浪费资源,还不如在 for 循环之前就 check 一次,如果 1w > 9k,直接报错即可。 ### 2 阻塞新增 新增有多种方法,如:add、put、offer,三者的区别上文有说。我们拿 put 方法为例,put 方法在碰到队列满的时候,会一直阻塞下去,直到队列不满时,并且自己被唤醒时,才会继续去执行,源码如下: ``` // 把e新增到队列的尾部。 // 如果有可以新增的空间的话,直接新增成功,否则当前线程陷入等待 public void put(E e) throws InterruptedException { // e 为空,抛出异常 if (e == null) throw new NullPointerException(); // 预先设置 c 为 -1,约定负数为新增失败 int c = -1; Node<E> node = new Node<E>(e); final ReentrantLock putLock = this.putLock; final AtomicInteger count = this.count; // 设置可中断锁 putLock.lockInterruptibly(); try { // 队列满了 // 当前线程阻塞,等待其他线程的唤醒(其他线程 take 成功后就会唤醒此处被阻塞的线程) while (count.get() == capacity) { // await 无限等待 notFull.await(); } // 队列没有满,直接新增到队列的尾部 enqueue(node); // 新增计数赋值,注意这里 getAndIncrement 返回的是旧值 // 这里的 c 是比真实的 count 小 1 的 c = count.getAndIncrement(); // 如果链表现在的大小 小于链表的容量,说明队列未满 // 可以尝试唤醒一个 put 的等待线程 if (c + 1 < capacity) notFull.signal(); } finally { // 释放锁 putLock.unlock(); } // c==0,代表队列里面有一个元素 // 会尝试唤醒一个take的等待线程 if (c == 0) signalNotEmpty(); } // 入队,把新元素放到队尾 private void enqueue(Node<E> node) { last = last.next = node; } ``` 从源码中我们可以总结以下几点: 1. 往队列新增数据,第一步是上锁,所以新增数据是线程安全的; 2. 队列新增数据,简单的追加到链表的尾部即可; 3. 新增时,如果队列满了,当前线程是会被阻塞的,阻塞的底层使用是锁的能力,底层实现其它也和队列相关,原理我们在锁章节会说到; 4. 新增数据成功后,在适当时机,会唤起 put 的等待线程(队列不满时),或者 take 的等待线程(队列不为空时),这样保证队列一旦满足 put 或者 take 条件时,立马就能唤起阻塞线程,继续运行,保证了唤起的时机不被浪费。 以上就是 put 方法的原理,至于 offer 方法阻塞超过一端时间后,仍未成功,就会直接返回默认值的实现,和 put 方法相比只修改了几行代码,如下截图: ![](https://img.kancloud.cn/dc/64/dc649ee824669e00ae5f86673ee4cb54_2444x1372.jpg) ### 3 阻塞删除 删除的方法也很多,我们主要看两个关键问题: 1. 删除的原理是怎样的; 2. 查看并删除和只查看不删除两种的区别是如何实现的。 首先我们来看第一个问题,我们以 take 方法为例,说明一下查看并删除的底层源码: ``` // 阻塞拿数据 public E take() throws InterruptedException { E x; // 默认负数,代表失败 int c = -1; // count 代表当前链表数据的真实大小 final AtomicInteger count = this.count; final ReentrantLock takeLock = this.takeLock; takeLock.lockInterruptibly(); try { // 空队列时,阻塞,等待其他线程唤醒 while (count.get() == 0) { notEmpty.await(); } // 非空队列,从队列的头部拿一个出来 x = dequeue(); // 减一计算,注意 getAndDecrement 返回的值是旧值 // c 比真实的 count 大1 c = count.getAndDecrement(); // 如果队列里面有值,从 take 的等待线程里面唤醒一个。 // 意思是队列里面有值啦,唤醒之前被阻塞的线程 if (c > 1) notEmpty.signal(); } finally { // 释放锁 takeLock.unlock(); } // 如果队列空闲还剩下一个,尝试从 put 的等待线程中唤醒一个 if (c == capacity) signalNotFull(); return x; } // 队头中取数据 private E dequeue() { Node<E> h = head; Node<E> first = h.next; h.next = h; // help GC head = first; E x = first.item; first.item = null;// 头节点指向 null,删除 return x; } ``` 整体流程和 put 很相似,都是先上锁,然后从队列的头部拿出数据,如果队列为空,会一直阻塞到队列有值为止。 而查看不删除元素更加简单,直接把队列头的数据拿出来即可,我们以 peek 为例,源码如下: ``` // 查看并不删除元素,如果队列为空,返回 null public E peek() { // count 代表队列实际大小,队列为空,直接返回 null if (count.get() == 0) return null; final ReentrantLock takeLock = this.takeLock; takeLock.lock(); try { // 拿到队列头 Node<E> first = head.next; // 判断队列头是否为空,并返回 if (first == null) return null; else return first.item; } finally { takeLock.unlock(); } } ``` 可以看出,查看并删除,和查看不删除两者从队头拿数据的逻辑不太一致,从而导致一个会删除,一个不会删除队头数据。 ### 4 总结 本文通过 LinkedBlockingQueue 的源码,来介绍了下链表队列,当队列满和空的场景下,新增和删除数据时,队列有啥变化。 队列本身就是一个阻塞工具,我们可以把这个工具应用到各种阻塞场景中,比如说队列应用到线程池,当线程池跑满时,我们把新的请求都放到阻塞队列中等待;队列应用到消息队列,当消费者处理能力有限时,我们可以把消息放到队列中等待,让消费者慢慢消费;每应用到一个新的场景中,都是一个新的技术工具,所以学好队列,用处很大。