💎一站式轻松地调用各大LLM模型接口,支持GPT4、智谱、星火、月之暗面及文生图 广告
# Java关键字volatile ## 提纲 ![](https://img.kancloud.cn/d0/97/d0972ed8bc45ec59cba59eb308055754_1614x1100.png) ## 定义 语义上,volatile是表示易变的、不确定的。 功能上,是Java提供的最轻量级的同步机制。 ## 前因:从CPU缓存架构类比JMM线程工作内存和主内存关系 要弄懂如何保证可见性的,请看下图,左侧是CPU的缓存架构图: ![](https://img.kancloud.cn/65/e5/65e5262acbf3bfdc13933e143d43576d_1492x1014.png) 如下图是一些时间参考,可更加直观的感受到各个组件的访问速度。 ![](https://img.kancloud.cn/2f/d4/2fd4896988e5dfaba560b28d80246287_644x410.png) 因为CPU的执行速度和内存的读写速度,相差太大。 CPU完成操作后,如果要等到内存也执行完成再继续下一个操作的话,对CPU算力就是极大的浪费。所以为了匹配2者的速度差,引入了高速缓存。现在CPU一般都有3级缓存,其中一级缓存离CPU核最近,速度也最快,可分为指令缓存和数据缓存2部分;下面是二级缓存,一个CPU核心就配备一个一级缓存和二级缓存的,是私有的。而三级缓存则是共享的,再下面是数据总线和主内存。 如下图是CPU的基本信息: ![](https://img.kancloud.cn/6e/40/6e40417b3a3113e1e8cf720cb2d0118a_870x858.png) 引入了高速缓存,虽然能让CPU效率提升,但是也带来了缓存一致性问题。为了解决这个问题,有两种方案,一是通过总线锁实现强一致性;二是缓存一致性协议,目前大多数采用的是MESI缓存一致性协议。(这2个方案都是硬件级别的) **随着CPU技术的发展,在CPU硬件级别多是使用的第二种方式,因为锁住总线期间,其他CPU无法访问内存,导致性能下降** 而对于Java并发环境下,多线程的共享数据一致性问题也是类似,Java内存模型参考上述的CPU缓存架构实现了自己的线程、工作内存和主内存的关系,如上图里的右侧部分。 ### 总线锁 所谓总线锁就是使用处理器提供的一个LOCK#信号,当一个处理器在总线上输出此信号时,其他处理器的请求将被阻塞住,那么该处理器可以独占共享内存,从而保证操作的原子性。 ### 缓存一致性协议MESI MESI协议是当前最主流的缓存一致性协议,在MESI协议中,每个缓存行有4个状态,可用2个bit表示,它们分别是: ``` Modified(修改):数据有效,数据被修改了,和内存中数据不一致,数据只存在于本Cache中。 Exclusive(独享):数据有效,数据和内存中的数据一致,数据只存在于本Cache中。 Shared(共享):数据有效,数据和内存中的数据一致,数据存在多个Cache中。 Invalid(无效):数据无效,一旦数据被标记为无效,那效果就等同于它从来没被加载到缓存中。 ``` 其详细状态转换如下: ![](https://img.kancloud.cn/de/b5/deb5659392a4b0093b82fc02ce18dfb4_872x1697.png) ## 特性 因为Java内存模型对volatile关键字的支持,使得volatile修饰的变量(实例字段、静态变量或者数组对象的元素,不包含局部变量,因为局部变量是线程私有的)具备了如下特性: * **多线程间的可见性** * **有序性,禁止指令重排序** * **不保证原子性,如volatile int i=1;i++;** ## volatile底层实现原理 ### volatile修饰的底层区别 首先通过如下一段DCL(double check lock)程序来比对一下有volatile和没有volatile修饰变量的在汇编指令上的区别: ~~~ public class VolatileSingleton { public static volatile VolatileSingleton instance; public static VolatileSingleton getInstance(){ if(instance == null){ synchronized(VolatileSingleton.class){ if(instance== null){ instance = new VolatileSingleton(); } } } return instance; } public static void main(String[] args) { VolatileSingleton.getInstance(); } } ~~~ 通过加上如下虚拟机参数,可以只显示getInstance()方法的汇编指令: ``` # server模式运行 -server # 让虚拟机编译模式执行代码 -Xcomp # 使用hsdis来显示执行的汇编指令,不同平台的hsdis插件请自行查阅安装 -XX:+UnlockDiagnosticVMOptions -XX:+PrintAssembly # 如下2个命令,只打印关心部分的汇编指令,如果不指定会打印很多其他方法的汇编,造成混乱 # 编译命令,不要内联编译getInstance方法 -XX:CompileCommand=dontinline,*VolatileSingleton.getInstance # 编译命令,只编译getInstance方法 -XX:CompileCommand=compileonly,*VolatileSingleton.getInstance ``` 最后将没有加volatile修饰的汇编指令保存到novolatile.txt,加了volatile的保存到volatile.txt,再使用idea的compare with 对比如下图: ![](https://img.kancloud.cn/ba/9f/ba9f0efe3d199c045164ee8f30fd39e4_2960x1572.png) 会发现加了volatile的会多出一行 **lock addl $0x0,(%rsp)** 的汇编指令,这个指令是一个内存屏障。 指令`lock addl $0x0,(%esp)`是一个空操作,关键在于 lock 前缀,查询 IA32 手册,它的作用是使得本 CPU 的 Cache 写入了内存,该写入动作也会引起别的 CPU invalidate 其 Cache。所以通过这样一个空操作,可让前面 volatile 变量的修改对其他 CPU 立即可见。 ### volatile基于软内存屏障实现可见性和有序性 ![](https://img.kancloud.cn/8c/12/8c1288f4d4ac3550ae016c72ed8fe13b_1600x1298.png) 通过内存屏障指令lock,如果有修改,处理器会将该变量所在缓存行的数据会写到主内存,并使得其他CPU里该变量所在的缓存行失效,从而保证该变量的可见性。 而且内存屏障会保证后面的指令不会重排序到屏障前面,从而保证有序性。 #### 可见性定义 对于共享变量a,当线程1修改a的值后,其他线程能立即知道这个修改,就说变量a对所有线程有可见性。 #### 可见性例子 ~~~ /** * volatile 可见性测试 */ public class VolatileVisibilityTest { private static volatile boolean ready; private static int number; private static class ReaderThread extends Thread{ @Override public void run() { while (!ready); System.out.println(number); } } public static void main(String[] args) throws InterruptedException { new ReaderThread().start(); Thread.sleep(1000); number = 42; ready = true; Thread.sleep(10000); } } /** * 因为JMM保证了volatile变量ready的可见性,在main线程中修改为true; * ReaderThread线程能应用到这个修改,则while(!ready)循环得以跳过。 * 则输出42,,10秒后退出程序。如果ready没有修饰为volatile,则没有可见性,线程Reader会陷入死循环,程序永远不会停止。 */ ~~~ ### volatile不保证原子性 比如复杂操作,i++; ~~~ /** * volatile不保证原子性 * @Author: mango * @Date: 2022/7/4 11:32 下午 */ public class VolatileNoAtomicTest { private static volatile int number = 0; static class AdderThread extends Thread{ @Override public void run() { for(int i=0;i<10000;i++){ number++; } } } public static void main(String[] args) throws InterruptedException { Thread t1 = new AdderThread(); t1.start(); Thread t2 = new AdderThread(); t2.start(); t1.join(); t2.join(); System.out.println(number); } } /** * 结果: * 有时候输出小于20000的值,说明number++无法保证原子性 */ ~~~ ## volatile优化 追加volatile变量的宽度为操作系统缓存行的宽度,一般为64字节。Java中对象的引用是4字节,`LinkedTransferQueue`会在每个入队元素的对象引用后填充60个字节,将元素补齐到64字节来提升并发下的入队和出队效率。使用追加到64字节的方式来填满高速缓冲区的缓存行,避免头接点和尾节点加载到同一个缓存行,使得头尾节点在修改时不会互相锁定。 ### 不需要补齐到64字节的场景 1. 系统的缓存行不是64字节的,有的是32字节。 2. 共享变量不会被频繁的写。 ## 参考文档 * 书籍:葛一鸣 *《Java高并发程序设计第二版》 * 网上文章:https://www.cnblogs.com/zhangxl1016/articles/16001715.html * 网上文章:https://blog.csdn.net/stackfuture/article/details/122252734 * 网上文章:https://www.cnblogs.com/hbbbs/articles/12116286.html