# Java关键字volatile
## 提纲
![](https://img.kancloud.cn/d0/97/d0972ed8bc45ec59cba59eb308055754_1614x1100.png)
## 定义
语义上,volatile是表示易变的、不确定的。
功能上,是Java提供的最轻量级的同步机制。
## 前因:从CPU缓存架构类比JMM线程工作内存和主内存关系
要弄懂如何保证可见性的,请看下图,左侧是CPU的缓存架构图:
![](https://img.kancloud.cn/65/e5/65e5262acbf3bfdc13933e143d43576d_1492x1014.png)
如下图是一些时间参考,可更加直观的感受到各个组件的访问速度。
![](https://img.kancloud.cn/2f/d4/2fd4896988e5dfaba560b28d80246287_644x410.png)
因为CPU的执行速度和内存的读写速度,相差太大。
CPU完成操作后,如果要等到内存也执行完成再继续下一个操作的话,对CPU算力就是极大的浪费。所以为了匹配2者的速度差,引入了高速缓存。现在CPU一般都有3级缓存,其中一级缓存离CPU核最近,速度也最快,可分为指令缓存和数据缓存2部分;下面是二级缓存,一个CPU核心就配备一个一级缓存和二级缓存的,是私有的。而三级缓存则是共享的,再下面是数据总线和主内存。
如下图是CPU的基本信息:
![](https://img.kancloud.cn/6e/40/6e40417b3a3113e1e8cf720cb2d0118a_870x858.png)
引入了高速缓存,虽然能让CPU效率提升,但是也带来了缓存一致性问题。为了解决这个问题,有两种方案,一是通过总线锁实现强一致性;二是缓存一致性协议,目前大多数采用的是MESI缓存一致性协议。(这2个方案都是硬件级别的)
**随着CPU技术的发展,在CPU硬件级别多是使用的第二种方式,因为锁住总线期间,其他CPU无法访问内存,导致性能下降**
而对于Java并发环境下,多线程的共享数据一致性问题也是类似,Java内存模型参考上述的CPU缓存架构实现了自己的线程、工作内存和主内存的关系,如上图里的右侧部分。
### 总线锁
所谓总线锁就是使用处理器提供的一个LOCK#信号,当一个处理器在总线上输出此信号时,其他处理器的请求将被阻塞住,那么该处理器可以独占共享内存,从而保证操作的原子性。
### 缓存一致性协议MESI
MESI协议是当前最主流的缓存一致性协议,在MESI协议中,每个缓存行有4个状态,可用2个bit表示,它们分别是:
```
Modified(修改):数据有效,数据被修改了,和内存中数据不一致,数据只存在于本Cache中。
Exclusive(独享):数据有效,数据和内存中的数据一致,数据只存在于本Cache中。
Shared(共享):数据有效,数据和内存中的数据一致,数据存在多个Cache中。
Invalid(无效):数据无效,一旦数据被标记为无效,那效果就等同于它从来没被加载到缓存中。
```
其详细状态转换如下:
![](https://img.kancloud.cn/de/b5/deb5659392a4b0093b82fc02ce18dfb4_872x1697.png)
## 特性
因为Java内存模型对volatile关键字的支持,使得volatile修饰的变量(实例字段、静态变量或者数组对象的元素,不包含局部变量,因为局部变量是线程私有的)具备了如下特性:
* **多线程间的可见性**
* **有序性,禁止指令重排序**
* **不保证原子性,如volatile int i=1;i++;**
## volatile底层实现原理
### volatile修饰的底层区别
首先通过如下一段DCL(double check lock)程序来比对一下有volatile和没有volatile修饰变量的在汇编指令上的区别:
~~~
public class VolatileSingleton {
public static volatile VolatileSingleton instance;
public static VolatileSingleton getInstance(){
if(instance == null){
synchronized(VolatileSingleton.class){
if(instance== null){
instance = new VolatileSingleton();
}
}
}
return instance;
}
public static void main(String[] args) {
VolatileSingleton.getInstance();
}
}
~~~
通过加上如下虚拟机参数,可以只显示getInstance()方法的汇编指令:
```
# server模式运行
-server
# 让虚拟机编译模式执行代码
-Xcomp
# 使用hsdis来显示执行的汇编指令,不同平台的hsdis插件请自行查阅安装
-XX:+UnlockDiagnosticVMOptions
-XX:+PrintAssembly
# 如下2个命令,只打印关心部分的汇编指令,如果不指定会打印很多其他方法的汇编,造成混乱
# 编译命令,不要内联编译getInstance方法
-XX:CompileCommand=dontinline,*VolatileSingleton.getInstance
# 编译命令,只编译getInstance方法
-XX:CompileCommand=compileonly,*VolatileSingleton.getInstance
```
最后将没有加volatile修饰的汇编指令保存到novolatile.txt,加了volatile的保存到volatile.txt,再使用idea的compare with 对比如下图:
![](https://img.kancloud.cn/ba/9f/ba9f0efe3d199c045164ee8f30fd39e4_2960x1572.png)
会发现加了volatile的会多出一行 **lock addl $0x0,(%rsp)** 的汇编指令,这个指令是一个内存屏障。
指令`lock addl $0x0,(%esp)`是一个空操作,关键在于 lock 前缀,查询 IA32 手册,它的作用是使得本 CPU 的 Cache 写入了内存,该写入动作也会引起别的 CPU invalidate 其 Cache。所以通过这样一个空操作,可让前面 volatile 变量的修改对其他 CPU 立即可见。
### volatile基于软内存屏障实现可见性和有序性
![](https://img.kancloud.cn/8c/12/8c1288f4d4ac3550ae016c72ed8fe13b_1600x1298.png)
通过内存屏障指令lock,如果有修改,处理器会将该变量所在缓存行的数据会写到主内存,并使得其他CPU里该变量所在的缓存行失效,从而保证该变量的可见性。
而且内存屏障会保证后面的指令不会重排序到屏障前面,从而保证有序性。
#### 可见性定义
对于共享变量a,当线程1修改a的值后,其他线程能立即知道这个修改,就说变量a对所有线程有可见性。
#### 可见性例子
~~~
/**
* volatile 可见性测试
*/
public class VolatileVisibilityTest {
private static volatile boolean ready;
private static int number;
private static class ReaderThread extends Thread{
@Override
public void run() {
while (!ready);
System.out.println(number);
}
}
public static void main(String[] args) throws InterruptedException {
new ReaderThread().start();
Thread.sleep(1000);
number = 42;
ready = true;
Thread.sleep(10000);
}
}
/**
* 因为JMM保证了volatile变量ready的可见性,在main线程中修改为true;
* ReaderThread线程能应用到这个修改,则while(!ready)循环得以跳过。
* 则输出42,,10秒后退出程序。如果ready没有修饰为volatile,则没有可见性,线程Reader会陷入死循环,程序永远不会停止。
*/
~~~
### volatile不保证原子性
比如复杂操作,i++;
~~~
/**
* volatile不保证原子性
* @Author: mango
* @Date: 2022/7/4 11:32 下午
*/
public class VolatileNoAtomicTest {
private static volatile int number = 0;
static class AdderThread extends Thread{
@Override
public void run() {
for(int i=0;i<10000;i++){
number++;
}
}
}
public static void main(String[] args) throws InterruptedException {
Thread t1 = new AdderThread();
t1.start();
Thread t2 = new AdderThread();
t2.start();
t1.join();
t2.join();
System.out.println(number);
}
}
/**
* 结果:
* 有时候输出小于20000的值,说明number++无法保证原子性
*/
~~~
## volatile优化
追加volatile变量的宽度为操作系统缓存行的宽度,一般为64字节。Java中对象的引用是4字节,`LinkedTransferQueue`会在每个入队元素的对象引用后填充60个字节,将元素补齐到64字节来提升并发下的入队和出队效率。使用追加到64字节的方式来填满高速缓冲区的缓存行,避免头接点和尾节点加载到同一个缓存行,使得头尾节点在修改时不会互相锁定。
### 不需要补齐到64字节的场景
1. 系统的缓存行不是64字节的,有的是32字节。
2. 共享变量不会被频繁的写。
## 参考文档
* 书籍:葛一鸣 *《Java高并发程序设计第二版》
* 网上文章:https://www.cnblogs.com/zhangxl1016/articles/16001715.html
* 网上文章:https://blog.csdn.net/stackfuture/article/details/122252734
* 网上文章:https://www.cnblogs.com/hbbbs/articles/12116286.html
- 面试突击
- Java虚拟机
- 认识字节码
- 000Java发展历史
- 000Macos10.15.7上编译OpenJDK8u
- 001熟悉Java内存区域
- 002熟悉HotSpot中的对象
- 003Java如何计算对象大小
- 004垃圾判定算法与4大引用
- 005回收堆和方法区中对象
- 006垃圾收集算法
- 007HotSpot虚拟机垃圾算法实现篇1
- 007HotSpot虚拟机垃圾算法实现篇2
- 007HotSpot虚拟机垃圾算法实现篇3
- 008垃圾收集器
- 009内存分配与回收策略
- 010Java虚拟机相关工具
- 011调优案例分析
- 012一次IDEA的启动速度调优
- 013类文件Class的结构
- 014熟悉字节码指令
- 015类加载机制(过程)
- 016类加载器
- IDEA的JVM参数
- Java基础
- Java自动装箱与拆箱
- Java基础数据类型
- Java方法的参数传递
- Java并发
- 001走入并行的世界
- 002并行程序基础
- 003熟悉Java内存模型JMM
- 004Java并发之volatile关键字
- 005线程池入门到精通
- 006Java多线程间的同步控制方法
- 007Java维基准测试框架JMH
- 008Java并发容器
- 009Java的线程实现
- 010Java关键字synchronized
- 011一些并行模式的熟悉
- 单例模式和不变模式
- 生产者消费者模式
- Future模式
- 012一些并行算法的熟悉
- 面试总结
- 长亮一面