18 线程作用域内共享变量—深入解析ThreadLocal · Java并发编程学习宝典(漫画版)

## 18 线程作用域内共享变量—深入解析ThreadLocal > 一个人追求的目标越高，他的才力就发展得越快，对社会就越有益。 > ——高尔基本章前面三节分别讲解了线程同步的三种方式。无论是轻量级的Atomic、volatile，还是synchronized，其实都是采用同步的方式解决了线程安全问题。本节我们将介绍另外一种解决线程安全问题的思路，线程封闭。如果你有一个全局共享的变量，那么多线程并发的时候，对这个共享变量的访问是不安全的。方法内的局部变量是线程安全的，由于每个线程都会有自己的副本。也就是说局部变量被封闭在线程内部，其它线程无法访问（引用型有所区别）。那么有没有作用域介于两者之间，既能保证线程安全，又不至于只局限于方法内部的方式呢？答案是肯定的，我们使用ThreadLocal就可以做到这一点。ThreadLocal变量的作用域是为线程，也就是说线程内跨方法共享。例如某个对象的方法A对threadLocal变量赋值，在同一个线程中的另外一个对象的方法B能够读取到该值。因为作用域为同一个线程，那么自然就是线程安全的。但是需要注意的是，如果threadLocal存储的是共享变量的引用，那么同样会有线程安全问题。 ## 1、ThreadLocal 的使用场景 ThreadLocal的特性决定了它的使用场景。由于ThreadLocal中存储的变量是线程隔离的，所以一般在以下情况使用ThreadLocal： 1、存储需要在线程隔离的数据。比如线程执行的上下文信息，每个线程是不同的，但是对于同一个线程来说会共享同一份数据。Spring MVC的 RequestContextHolder 的实现就是使用了ThreadLocal； 2、跨层传递参数。层次划分在软件设计中十分常见。层次划分后，体现在代码层面就是每层负责不同职责，一个完整的业务操作，会由一系列不同层的类的方法调用串起来完成。有些时候第一层获得的一个变量值可能在第三层、甚至更深层的方法中才会被使用。如果我们不借助ThreadLocal，就只能一层层地通过方法参数进行传递。使用ThreadLocal后，在第一层把变量值保存到ThreadLocal中，在使用的层次方法中直接从ThreadLocal中取出，而不用作为参数在不同方法中传来传去。不过千万不要滥用ThreadLocal，它的本意并不是用来跨方法共享变量的。结合第一种情况，我们放入ThreadLocal跨层传递的变量一般也是具有上下文属性的。比如用户的信息等。这样我们在AOP处理异常或者其他操作时可以很方便地获取当前登录用户的信息。 ## 2、如何使用 ThreadLocal ThreadLocal使用起来非常简单，我们先看一个简单的例子。可以看到每个线程为同一个ThreadLocal对象set不同的值，但各个线程打印出来的依旧是自己保存进去的值，并没有被其它线程所覆盖。一般来说，在实践中，我们会把ThreadLocal对象声名为static final，作为私有变量封装到自定义的类中。另外提供static的set和get方法。如下面的代码： ~~~java public final class OperationInfoRecorder { private static final ThreadLocal<OperationInfoDTO> THREAD_LOCAL = new ThreadLocal<>(); private OperationInfoRecorder() { } public static OperationInfoDTO get() { return THREAD_LOCAL.get(); } public static void set(OperationInfoDTO operationInfoDTO) { THREAD_LOCAL.set(operationInfoDTO); } public static void remove() { THREAD_LOCAL.remove(); } } ~~~ 这样做的目的有二: 1、static 确保全局只有一个保存OperationInfoDTO对象的ThreadLocal实例； 2、final 确保ThreadLocal的实例不可更改。防止被意外改变，导致放入的值和取出来的不一致。另外还能防止ThreadLocal的内存泄漏，具体原因下文中会有讲解。使用的时候可以在任何方法的任何位置调用OperationInfoRecorder的set或者get方法，保存和取出。如下面代码： ~~~ OperationInfoRecorder.set(operationInfoDTO) OperationInfoRecorder.get() ~~~ ## 3、ThreadLocal源代码解析学习到这里，你一定很好奇ThreadLocal是如何做到多个线程对同一个对象set操作，但只会get出自己set进去的值呢？这个现象有点违背我们的认知。接下来我们就从set方法入手，来看看ThreadLocal的源代码： ~~~java public void set(T value) { Thread t = Thread.currentThread(); ThreadLocalMap map = getMap(t); if (map != null) map.set(this, value); else createMap(t, value); } ~~~ 一眼看过去，一下就可以看到map。没错，如果ThreadLocal能够保存多个线程的变量值，那么它一定是借助容器来实现的。这个map不是一般的map，可以看到它是通过当前线程对象获取到的ThreadLocalMap。看到这里应该看出些端倪，这个map其实是和Thread绑定的。接下来我们看getMap方法的代码： ~~~java ThreadLocalMap getMap(Thread t) { return t.threadLocals; } ~~~ 原来这个ThreadLocal就存方法Thread对象上。下面我们看看Thread中的相关代码： ~~~java /* ThreadLocal values pertaining to this thread. This map is maintained * by the ThreadLocal class. */ ThreadLocal.ThreadLocalMap threadLocals = null; ~~~ 注释中写的很清楚，这个属性由ThreadLocal来维护。threadLocals的访问控制决定在包外是无法直接访问的。所以我们在使用的时候只能通过ThreadLocal对象来访问。 set时，会把当前threadLocal对象作为key，你想要保存的对象作为value，存入map。看到这里，我们大至已经理清了ThreadLocal和Thread的关系，我们看下图： ![图片描述](https://img.mukewang.com/5db79dc30001b6b008800515.jpg) 我们接下来分析get方法，代码如下： ~~~java public T get() { Thread t = Thread.currentThread(); ThreadLocalMap map = getMap(t); if (map != null) { ThreadLocalMap.Entry e = map.getEntry(this); if (e != null) { @SuppressWarnings("unchecked") T result = (T)e.value; return result; } } return setInitialValue(); } ~~~ get方法也是先取得当前线程对象中保存的ThreadLocalMap对象，然后使用当前threadLocal对象从map中取得相应的value。每个Thread的ThreadMap以threadLocal作为key，保存自己线程的value副本。我们可以这么来理解ThreadLocal，其实ThreadLocal对象是你要真正保存对象的身份代表。而这个身份在每个线程中对应的值，其实是保存在每个线程中，并没有保存在ThreadLocal对象中。这里可以举个例子，学校里要每班评选一名学习标兵，一名道德标兵。班主任会进行评选然后记录下来。学生标兵及道德标兵的身份就是两个ThreadLocal对象，而每个班主任是一个线程，记录的评选结果的小本子就是ThreadLocalMap对象。每个班主任会在自己的小本子上记录下评选结果，比如说一班班主任记录：道德标兵：小明，学习标兵：小红。二班班主任记录：道德标兵：小赵，学习标兵：小岩。通过这个例子大家应该很清楚ThreadLocal的原理了。 ThreadLocal的设计真的非常巧妙，看似自己保存了每个线程的变量副本，其实每个线程的变量副本是保存在线程对象中，那么自然就线程隔离了。如此分析起来，是不是有一种ThreadLocal没做什么事情，却抢了头功的感觉？其实不然。Thread对象中用来保存变量副本的ThreadLocalMap的定义就在ThreadLocal中。我们接下来分析ThreadLocalMap的源代码。 ## 4、ThreadLocalMap分析 ThreadLocalMap是ThreadLocal的静态内部类，我们单独一小节来讲解它。ThreadLocalMap的功能其实是和HashMap类似的，但是为什么不直接使用HashMap呢？˙在ThreadLocalMap中使用WeakReference包装后的ThreadLocal对象作为key，也就是说这里对ThreadLocal对象为弱引用。当ThreadLocal对象在ThreadLocalMap引用之外，再无其他引用的时候能够被垃圾回收。如下面代码所示： ~~~java static class Entry extends WeakReference<ThreadLocal<?>> { /** The value associated with this ThreadLocal. */ Object value; Entry(ThreadLocal<?> k, Object v) { super(k); value = v; } } ~~~ 这样做会带来新的问题。如果ThreadLocal对象被回收，那么ThreadLocalMap中保存的key值就变成了null，而value会一直被Entry引用，而Entry又被threadLocalMap对象引用，threadLocalMap对象又被Thread对象所引用，那么当Thread一直不终结的话，value对象就会一直驻留在内存中，直至Thread被销毁后，才会被回收。这就是ThreadLocal引起内存泄漏问题。而ThreadLocalMap在设计的时候也考虑到这一点，在get和set的时候，会把遇到的key为null的entry清理掉。不过这样做也不能100%保证能够清理干净。我们可以通过以下两种方式来避免这个问题： 1、把ThreadLocal对象声明为static，这样ThreadLocal成为了类变量，生命周期不是和对象绑定，而是和类绑定，延长了声明周期，避免了被回收； 2、在使用完ThreadLocal变量后，手动remove掉，防止ThreadLocalMap中Entry一直保持对value的强引用。导致value不能被回收。 ## 4、总结通过本节学习，我们掌握了ThreadLocal 的原理和其使用场景。绝大多数情况下，ThreadLocal用于存储和线程相关的上下文信息，也就是线程共享的信息，便于同一线程的不同方法中取值，而不用作为方法参数层层传递。 }