## 19 自己动手丰衣足食—简单线程池实现
> 学习要注意到细处,不是粗枝大叶的,这样可以逐步学习、摸索,找到客观规律。
> —— 徐特立
专栏写到这里,已经完成了前四章的内容。前四章主要围绕线程基础概念在做讲解。比如如何创建线程,多线程并发的问题等等。从本章开始我们会开始讲解 JDK 提供给我们的并发工具类,我们在做多线程开发时经常会借助这些工具类,不但节省了工作量,而且程序也更为健壮。
## 1、创建线程的问题
并发的本质其实就是任务的并行处理。绝大多数的并发程序都是围绕离散的任务执行来进行构建。我们在设计此类多线程程序时,首要任务就是对任务进行划分,使得各个不同类型的任务之间相互独立,没有依赖。这样我们就可以并行处理任意的任务。基于我们之前所学习的知识,我们可以为每一个任务建立一个线程来执行。不过我们知道电脑的资源是有限的,无止境的创建线程,性能并不会一直提升,反而会达到峰值后开始衰减。为每个任务都去创建线程存在如下的问题:
1. 线程创建需要消耗资源。通过前面的学习,我们知道线程的创建和启动都需要消耗资源,需要 JVM 和操作系统提供支持。如果线程运行的任务十分轻量级,那么会造成创建线程的时间开销比任务逻辑运行时间还要长;
2. CPU 性能有限。当活跃的线程超过了 CPU 的承载限度,那么会有大量线程参与竞争 CPU,造成系统额外的开销,但是永远都会有很多线程无法竞争到 CPU,造成了资源的浪费;
3. 系统能够支持的线程存在上限。如果超出上限,整个应用就会崩溃。
那么有没有一种方法,既能得到多线程的好处,又能避免以上的问题呢?
## 2、线程池简介
说了那么多,其实答案你肯定已经知道,那就是线程池。线程池的作用是维护一定数量的线程,接收任意数量的任务,这些任务被线程池中的线程并发执行。看到这是不是很像前面讲道德生产者 / 消费者模式?没错,线程池就是基于生产者 / 消费者模式来实现的。客户端调用线程池暴露的方法,向任务列表中生产任务,而线程池中的线程并发消费任务,执行任务的逻辑。
![图片描述](https://img1.sycdn.imooc.com/5dba4634000108ab11180527.jpg)
Java 提供了 Excutor 来实现线程池。不过为了加深对线程池的理解,本节我们先不介绍 Excutor,而是自己动手来实现一个线程池。
## 3、自开发线程池设计
接下来我们将开发一个简单的线程池程序 MyExecutor。正如前文所述,我们的线程池基于生产者 / 消费者模式设计。线程池中维护一个任务对列,线程池接收到的任务放入此队列中。另外还有一个线程队列,其实就是消费者队列,会轮询取得任务队列中的任务,进行执行。如下图所示。
![图片描述](https://img1.sycdn.imooc.com/5da56fae0001210a10180527.jpg)
MyExecutor 持有任务队列 RunnableTaskQueue 及固定数量的线程。客户端调用 MyExecutor 对外暴露的 execute 方法,像 RunnableTaskQueue 中添加任务。而 MyExecutor 维护的每个 Thread,其实只做一件事情 —— 不断从 RunnableTaskQueue 中取得 Runable 的实现,调用其 run 方法。run 方法的逻辑就是要执行的任务。而 RunnableTaskQueue 一旦任务被取完,就会开始 wait,线程阻塞。而一旦有新的任务被客户端添加进来,线程池中线程则被唤醒继续拉取任务并执行。如下图所示:
![图片描述](https://img1.sycdn.imooc.com/5da56fcd00014cdf10860559.jpg)
我们实现的这个简单的线程池主要有两个类
1. MyExecutor;
2. RunnableTaskQueue 。
另外还有个测试用的 Client 类。我们逐一讲解。
### 3.1 RunnableTaskQueue
先看 RunnableTaskQueue 类。这个类中维护了一个 Runnable 实现对象的 LinkedList。并且提供线程安全的 add 和 get 方法,用来添加任务和获取任务。利用 LinkedList 的特性,在获取任务的同时会从队列中移除。代码如下:
~~~java
public class RunnableTaskQueue {
private final LinkedList<Runnable> tasks = new LinkedList<>();
public Runnable getTask() throws InterruptedException {
synchronized (tasks) {
while (tasks.isEmpty()) {
System.out.println(Thread.currentThread().getName() + " says task queue is empty. i will wait");
tasks.wait();
}
return tasks.removeFirst();
}
}
public void addTask(Runnable runnable) {
synchronized (tasks) {
tasks.add(runnable);
tasks.notifyAll();
}
}
}
~~~
RunnableTaskQueue 是一个阻塞队列,这保证了线程池中的线程能够不断从中取得任务执行,没有任务时线程也能停下来等待。getTask 和 setTask 都会以同步的方式执行,确保线程安全,并且采用 wait 和 nofityAll 的方式让线程在一定条件下等待和继续运行。
### 3.2 MyExecutor
接下来我们看 MyExecutor 代码:
~~~java
public class MyExecutor {
private final int poolSize;
private final RunnableTaskQueue runnableTaskQueue;
private final List<Thread> threads = new ArrayList<>();
public MyExecutor(int poolSize) {
this.poolSize = poolSize;
this.runnableTaskQueue = new RunnableTaskQueue();
Stream.iterate(1, item -> item + 1).limit(poolSize).forEach(item -> {
initThread();
});
}
private void initThread() {
if (threads.size() <= poolSize) {
Thread thread = new Thread(() -> {
while (true) {
try {
Runnable task = runnableTaskQueue.getTask();
task.run();
} catch (InterruptedException e) {
e.printStackTrace();
}
}
});
threads.add(thread);
thread.start();
}
}
public void execute(Runnable runnable) {
runnableTaskQueue.addTask(runnable);
}
}
~~~
poolSize 是线程池的容量,在 MyExecutor 的构造函数中,我们会创建 poolSize 个 Thread。创建 Thread 的方法为 initThread。此方法中先比较已有线程数量是否达到 poolSize。未达到的话,则创建 thread,并且提供 run 的逻辑。这里采用 lambda 表达式的方式,传入 runnable。可以看到线程的 run 方法很简单,就是不断从 runnableTaskQueue 中取得 task,然后运行 task 的 run 方法。回忆下刚刚讲过的 runnableTaskQueue 的 getTask 方法,在没有 task 的时候,会让此线程陷入等待中。
execute 方法是对外暴露的执行任务的方法,方法中向 runnableTaskQueue 添加 task。addTask 方法中,在添加完 task 后,会 nofity 所有等待 task 的线程。
是不是很丝滑,getTask 时可能触发 wait,而一旦 addTask 则会 notifyAll。这一来一往,线程池就能顺畅地工作起来。
### 3.3 运行你的线程池
* **方式一**:
接下来我们看看客户端代码,对我们刚刚编写线程池做一下测试。我们看下面客户端的代码:
~~~java
public class Client {
public static void main(String[] args) {
MyExecutor executor = new MyExecutor(5);
Stream.iterate(1, item -> item + 1).limit(10).forEach(
item -> {
executor.execute(() -> {
try {
System.out.println(Thread.currentThread().getName() + " execute this task");
TimeUnit.SECONDS.sleep(2);
} catch (InterruptedException e) {
e.printStackTrace();
}
});
}
);
}
}
~~~
首先我们声明了一个 5 个线程的线程池。然后以 lambda 形式向线程池添加了 10 个任务。任务的内容很简单,只是打印执行任务线程的名称,然后 sleep 2 毫秒就结束了。这里大家可以先自己思考下程序运行的结果,再看下面的程序输出:
~~~java
Thread-0 says task queue is empty. i will wait
Thread-2 says task queue is empty. i will wait
Thread-1 says task queue is empty. i will wait
Thread-3 says task queue is empty. i will wait
Thread-4 says task queue is empty. i will wait
Thread-4 execute this task
Thread-3 execute this task
Thread-0 execute this task
Thread-2 execute this task
Thread-1 execute this task
Thread-4 execute this task
Thread-0 execute this task
Thread-3 execute this task
Thread-2 execute this task
Thread-1 execute this task
Thread-2 says task queue is empty. i will wait
Thread-3 says task queue is empty. i will wait
Thread-0 says task queue is empty. i will wait
Thread-1 says task queue is empty. i will wait
Thread-4 says task queue is empty. i will wait
~~~
以上输出是和程序执行过程保持一致的。下面我们分析下程序执行过程。
* 1、首先声明 5 个线程的线程池后,这 5 个线程会立即启动,然后从 RunnableTaskQueue 中 getTask;
* 2、由于还没有添加任务,所以 5 个线程全部开始 wait;
* 3、然后 10 个任务几乎同时被添加进线程池;
* 4、每添加一个 task,就会触发 task.notifyAll ()。使得所有线程从从 task 的 waitSet 中被弹出;
* 5、其中一个线程会取得锁,进入同步的 getTask 方法中获取一个 task;
* 6、获取 task 后释放锁;
* 7、执行这个 task 的 run 方法;
* 8、与此同时其他某个线程会获得锁,然后从 RunnableTaskQueue 获取任务。由于 10 个任务几乎同时被添加进来,所以 RunnableTaskQueue 中此时还有 9 个 task,第二个线程也可以顺利拿到 task。以此类推 5 个线程都能顺利取得 task 执行;
* 9、第一轮执行完毕后,RunnableTaskQueue 中还剩 5 个 task。于是 5 个线程在第二轮中又各自成功取得一个 task 执行;
* 10、当 5 个线程第三轮再去 getTask 时,发现 RunnableTaskQueue 已经没有任务了,所以 5 个线程全部开始 wait。
以上分析的执行过程和我们的输出完全吻合。
下面我们换一种执行方式。
* **方式二:**
~~~java
public class Client {
public static void main(String[] args) {
MyExecutor executor = new MyExecutor(5);
Stream.iterate(1, item -> item + 1).limit(10).forEach(
item -> {
try {
if(item%2==0){
TimeUnit.SECONDS.sleep(2);
}
} catch (InterruptedException e) {
e.printStackTrace();
}
executor.execute(() -> {
System.out.println(Thread.currentThread().getName() + " execute this task");
});
}
);
}
}
~~~
和方式一的区别是,客户端在 2 的整数倍时,sleep2 毫秒再创建。另外任务中不再 sleep。这样会造成生产得慢,消费得快,我们看下程序输出:
~~~java
Thread-0 says task queue is empty. i will wait
Thread-2 says task queue is empty. i will wait
Thread-1 says task queue is empty. i will wait
Thread-4 says task queue is empty. i will wait
Thread-3 says task queue is empty. i will wait
Thread-3 execute this task
Thread-4 says task queue is empty. i will wait
Thread-1 says task queue is empty. i will wait
Thread-2 says task queue is empty. i will wait
Thread-0 says task queue is empty. i will wait
Thread-3 says task queue is empty. i will wait
Thread-3 execute this task
Thread-2 says task queue is empty. i will wait
Thread-0 execute this task
Thread-1 says task queue is empty. i will wait
Thread-4 says task queue is empty. i will wait
Thread-0 says task queue is empty. i will wait
Thread-3 says task queue is empty. i will wait
Thread-3 execute this task
Thread-0 execute this task
Thread-4 says task queue is empty. i will wait
Thread-1 says task queue is empty. i will wait
Thread-2 says task queue is empty. i will wait
Thread-0 says task queue is empty. i will wait
Thread-3 says task queue is empty. i will wait
Thread-3 execute this task
Thread-2 says task queue is empty. i will wait
Thread-0 execute this task
Thread-1 says task queue is empty. i will wait
Thread-4 says task queue is empty. i will wait
Thread-0 says task queue is empty. i will wait
Thread-3 says task queue is empty. i will wait
Thread-3 execute this task
Thread-4 says task queue is empty. i will wait
Thread-0 execute this task
Thread-1 says task queue is empty. i will wait
Thread-2 says task queue is empty. i will wait
Thread-0 says task queue is empty. i will wait
Thread-3 says task queue is empty. i will wait
Thread-3 execute this task
Thread-0 says task queue is empty. i will wait
Thread-2 says task queue is empty. i will wait
Thread-1 says task queue is empty. i will wait
Thread-4 says task queue is empty. i will wait
Thread-3 says task queue is empty. i will wait
~~~
可以看到由于消费得快,每产生一个 task 会被迅速消费掉,所以绝大多是时间,大多睡线程都在 wait。另外我们注意看除了第一个 task 和最后一个 task,中间的 task 基本上都是成对被执行的,这是因为双数的任务被添加前要 sleep 2 毫秒,而单数 task 会被立即创建,这就造成双数的 task 产生和上一个 task 有时间间隔。10 个 task 就像被分成了 5 组,分别是 1、2 和 3、4 和 5、6 和 7、8 和 9、10。所以会呈现以上日志中的情况。
## 4、总结
本节我们自己实现了一个很简单的线程池,提供了非常有限的功能,并且线程池是固定大小。不过这已经足以体会线程池设计的核心思想。就是以固定数量的线程来轮询执行任务队列中的任务。有了这一节的学习,我相信下一节学习 JDK 提供的 Excutor 不会有任何障碍。
- 前言
- 第1章 Java并发简介
- 01 开篇词:多线程为什么是你必需要掌握的知识
- 02 绝对不仅仅是为了面试—我们为什么需要学习多线程
- 03 多线程开发如此简单—Java中如何编写多线程程序
- 04 人多力量未必大—并发可能会遇到的问题
- 第2章 Java中如何编写多线程
- 05 看若兄弟,实如父子—Thread和Runnable详解
- 06 线程什么时候开始真正执行?—线程的状态详解
- 07 深入Thread类—线程API精讲
- 08 集体协作,什么最重要?沟通!—线程的等待和通知
- 09 使用多线程实现分工、解耦、缓冲—生产者、消费者实战
- 第3章 并发的问题和原因详解
- 10 有福同享,有难同当—原子性
- 11 眼见不实—可见性
- 12 什么?还有这种操作!—有序性
- 13 问题的根源—Java内存模型简介
- 14 僵持不下—死锁详解
- 第4章 如何解决并发问题
- 15 原子性轻量级实现—深入理解Atomic与CAS
- 16 让你眼见为实—volatile详解
- 17 资源有限,请排队等候—Synchronized使用、原理及缺陷
- 18 线程作用域内共享变量—深入解析ThreadLocal
- 第5章 线程池
- 19 自己动手丰衣足食—简单线程池实现
- 20 其实不用造轮子—Executor框架详解
- 第6章 主要并发工具类
- 21 更高级的锁—深入解析Lock
- 22 到底哪把锁更适合你?—synchronized与ReentrantLock对比
- 23 按需上锁—ReadWriteLock详解
- 24 经典并发容器,多线程面试必备—深入解析ConcurrentHashMap上
- 25 经典并发容器,多线程面试必备—深入解析ConcurrentHashMap下
- 26不让我进门,我就在门口一直等!—BlockingQueue和ArrayBlockingQueue
- 27 倒数计时开始,三、二、一—CountDownLatch详解
- 28 人齐了,一起行动—CyclicBarrier详解
- 29 一手交钱,一手交货—Exchanger详解
- 30 限量供应,不好意思您来晚了—Semaphore详解
- 第7章 高级并发工具类及并发设计模式
- 31 凭票取餐—Future模式详解
- 32 请按到场顺序发言—Completion Service详解
- 33 分阶段执行你的任务-学习使用Phaser运行多阶段任务
- 34 谁都不能偷懒-通过 CompletableFuture 组装你的异步计算单元
- 35 拆分你的任务—学习使用Fork/Join框架
- 36 为多线程们安排一位经理—Master/Slave模式详解
- 第8章 总结
- 37 结束语