[TOC]
## 什么是MVCC
全称Multi-Version Concurrency Control,即`多版本并发控制`,主要是为了提高数据库的`并发性能`。以下文章都是围绕InnoDB引擎来讲,因为myIsam不支持事务。
同一行数据平时发生读写请求时,会`上锁阻塞`住。但mvcc用更好的方式去处理读—写请求,做到在发生读—写请求冲突时`不用加锁`。
这个读是指的`快照读`,而不是`当前读`,当前读是一种加锁操作,是`悲观锁`。
那它到底是怎么做到读—写`不用加锁`的,`快照读`和`当前读`又是什么鬼,跟着你们的`贴心老哥`,继续往下看。
![](https://p6-juejin.byteimg.com/tos-cn-i-k3u1fbpfcp/d05911f83aa34acea5ea2ff47cc42232~tplv-k3u1fbpfcp-zoom-1.image)
## 当前读、快照读都是什么鬼
什么是MySQL InnoDB下的当前读和快照读?
### 当前读
它读取的数据库记录,都是`当前最新`的`版本`,会对当前读取的数据进行`加锁`,防止其他事务修改数据。是`悲观锁`的一种操作。
如下操作都是当前读:
* select lock in share mode (共享锁)
* select for update (排他锁)
* update (排他锁)
* insert (排他锁)
* delete (排他锁)
* 串行化事务隔离级别
### 快照读
快照读的实现是基于`多版本`并发控制,即MVCC,既然是多版本,那么快照读读到的数据不一定是当前最新的数据,有可能是之前`历史版本`的数据。
如下操作是快照读:
* 不加锁的select操作(注:事务级别不是串行化)
### 快照读与mvcc的关系
`MVCCC`是“维持一个数据的多个版本,使读写操作没有冲突”的一个`抽象概念`。
这个概念需要具体功能去实现,这个具体实现就是`快照读`。(具体实现下面讲)
听完`贴心老哥`的讲解,是不是瞬间`茅厕顿开`。
![](https://p3-juejin.byteimg.com/tos-cn-i-k3u1fbpfcp/5c5fa9c5a396422294a508b7a009e0d5~tplv-k3u1fbpfcp-zoom-1.image)
## 数据库并发场景
* `读-读`:不存在任何问题,也不需要并发控制
* `读-写`:有线程安全问题,可能会造成事务隔离性问题,可能遇到脏读,幻读,不可重复读
* `写-写`:有线程安全问题,可能会存在更新丢失问题,比如第一类更新丢失,第二类更新丢失
## MVCC解决并发哪些问题?
mvcc用来解决读—写冲突的无锁并发控制,就是为事务分配`单向增长`的`时间戳`。为每个数据修改保存一个`版本`,版本与事务时间戳`相关联`。
读操作`只读取`该事务`开始前`的`数据库快照`。
**解决问题如下:**
* `并发读-写时`:可以做到读操作不阻塞写操作,同时写操作也不会阻塞读操作。
* 解决`脏读`、`幻读`、`不可重复读`等事务隔离问题,但不能解决上面的`写-写 更新丢失`问题。
**因此有了下面提高并发性能的`组合拳`:**
* `MVCC + 悲观锁`:MVCC解决读写冲突,悲观锁解决写写冲突
* `MVCC + 乐观锁`:MVCC解决读写冲突,乐观锁解决写写冲突
## MVCC的实现原理
它的实现原理主要是`版本链`,`undo日志` ,`Read View` 来实现的
### 版本链
我们数据库中的每行数据,除了我们肉眼看见的数据,还有几个`隐藏字段`,得开`天眼`才能看到。分别是`db_trx_id`、`db_roll_pointer`、`db_row_id`。
* db\_trx\_id
6byte,最近修改(修改/插入)`事务ID`:记录`创建`这条记录/`最后一次修改`该记录的`事务ID`。
* db\_roll\_pointer(版本链关键)
7byte,`回滚指针`,指向`这条记录`的`上一个版本`(存储于rollback segment里)
* db\_row\_id
6byte,隐含的`自增ID`(隐藏主键),如果数据表`没有主键`,InnoDB会自动以db\_row\_id产生一个`聚簇索引`。
* 实际还有一个`删除flag`隐藏字段, 记录被`更新`或`删除`并不代表真的删除,而是`删除flag`变了
![](https://p1-juejin.byteimg.com/tos-cn-i-k3u1fbpfcp/4810faee12844b31ad9f44d8012fe188~tplv-k3u1fbpfcp-zoom-1.image)
如上图,`db_row_id`是数据库默认为该行记录生成的`唯一隐式主键`,`db_trx_id`是当前操作该记录的`事务ID`,而`db_roll_pointer`是一个`回滚指针`,用于配合`undo日志`,指向上一个`旧版本`。
每次对数据库记录进行改动,都会记录一条`undo日志`,每条undo日志也都有一个`roll_pointer`属性(INSERT操作对应的undo日志没有该属性,因为该记录并没有更早的版本),可以将这些`undo日志都连起来`,`串成一个链表`,所以现在的情况就像下图一样:
![](https://p9-juejin.byteimg.com/tos-cn-i-k3u1fbpfcp/d2fa1c7ffdf241a09a790a34b4b8c817~tplv-k3u1fbpfcp-zoom-1.image)
对该记录每次更新后,都会将旧值放到一条undo日志中,就算是该记录的一个旧版本,随着更新次数的增多,所有的版本都会被`roll_pointer`属性连接成一个`链表`,我们把这个链表称之为`版本链`,版本链的头节点就是当前记录最新的值。另外,每个版本中还包含生成该版本时对应的事务id,这个信息很重要,在根据ReadView判断版本可见性的时候会用到。
### undo日志
Undo log 主要用于`记录`数据被`修改之前`的日志,在表信息修改之前先会把数据拷贝到`undo log`里。
当`事务`进行`回滚时`可以通过undo log 里的日志进行`数据还原`。
**Undo log 的用途**
* 保证`事务`进行`rollback`时的`原子性和一致性`,当事务进行`回滚`的时候可以用undo log的数据进行`恢复`。
* 用于MVCC`快照读`的数据,在MVCC多版本控制中,通过读取`undo log`的`历史版本数据`可以实现`不同事务版本号`都拥有自己`独立的快照数据版本`。
**undo log主要分为两种:**
* insert undo log
代表事务在insert新记录时产生的undo log , 只在事务回滚时需要,并且在事务提交后可以被立即丢弃
* update undo log(主要)
事务在进行update或delete时产生的undo log ; 不仅在事务回滚时需要,在快照读时也需要;
所以不能随便删除,只有在快速读或事务回滚不涉及该日志时,对应的日志才会被purge线程统一清除
### Read View(读视图)
事务进行`快照读`操作的时候生产的`读视图`(Read View),在该事务执行的快照读的那一刻,会生成数据库系统当前的一个`快照`。
记录并维护系统当前`活跃事务的ID`(没有commit,当每个事务开启时,都会被分配一个ID, 这个ID是递增的,所以越新的事务,ID值越大),是系统中当前不应该被`本事务`看到的`其他事务id列表`。
Read View主要是用来做`可见性`判断的, 即当我们`某个事务`执行`快照读`的时候,对该记录创建一个Read View读视图,把它比作条件用来判断`当前事务`能够看到`哪个版本`的数据,既可能是当前`最新`的数据,也有可能是该行记录的undo log里面的`某个版本`的数据。
**Read View几个属性**
* `trx_ids`: 当前系统活跃(`未提交`)事务版本号集合。
* `low_limit_id`: 创建当前read view 时“当前系统`最大事务版本号`+1”。
* `up_limit_id`: 创建当前read view 时“系统正处于活跃事务`最小版本号`”
* `creator_trx_id`: 创建当前read view的事务版本号;
### Read View可见性判断条件
![](https://p1-juejin.byteimg.com/tos-cn-i-k3u1fbpfcp/5a55a3e31e644bc0ae3d8e73a7176e0d~tplv-k3u1fbpfcp-zoom-1.image)
* `db_trx_id` < `up_limit_id` || `db_trx_id` == `creator_trx_id`(显示)
如果数据事务ID小于read view中的`最小活跃事务ID`,则可以肯定该数据是在`当前事务启之前`就已经`存在`了的,所以可以`显示`。
或者数据的`事务ID`等于`creator_trx_id` ,那么说明这个数据就是当前事务`自己生成的`,自己生成的数据自己当然能看见,所以这种情况下此数据也是可以`显示`的。
* `db_trx_id` >= `low_limit_id`(不显示)
如果数据事务ID大于read view 中的当前系统的`最大事务ID`,则说明该数据是在当前read view 创建`之后才产生`的,所以数据`不显示`。如果小于则进入下一个判断
* `db_trx_id`是否在`活跃事务`(trx\_ids)中
* `不存在`:则说明read view产生的时候事务`已经commit`了,这种情况数据则可以`显示`。
* `已存在`:则代表我Read View生成时刻,你这个事务还在活跃,还没有Commit,你修改的数据,我当前事务也是看不见的。
![](https://p1-juejin.byteimg.com/tos-cn-i-k3u1fbpfcp/14afe47c1add435c907682ca07babf74~tplv-k3u1fbpfcp-zoom-1.image)
## MVCC和事务隔离级别
上面所讲的`Read View`用于支持`RC`(Read Committed,读提交)和`RR`(Repeatable Read,可重复读)`隔离级别`的`实现`。
### RR、RC生成时机
* `RC`隔离级别下,是每个`快照读`都会`生成并获取最新`的`Read View`;
* 而在`RR`隔离级别下,则是`同一个事务中`的`第一个快照读`才会创建`Read View`, `之后的`快照读获取的都是`同一个Read View`,之后的查询就`不会重复生成`了,所以一个事务的查询结果每次`都是一样的`。
### 解决幻读问题
* `快照读`:通过MVCC来进行控制的,不用加锁。按照MVCC中规定的“语法”进行增删改查等操作,以避免幻读。
* `当前读`:通过next-key锁(行锁+gap锁)来解决问题的。
### RC、RR级别下的InnoDB快照读区别
* 在RR级别下的某个事务的对某条记录的第一次快照读会创建一个快照及Read View, 将当前系统活跃的其他事务记录起来,此后在调用快照读的时候,还是使用的是同一个Read View,所以只要当前事务在其他事务提交更新之前使用过快照读,那么之后的快照读使用的都是同一个Read View,所以对之后的修改不可见;
* 即RR级别下,快照读生成Read View时,Read View会记录此时所有其他活动事务的快照,这些事务的修改对于当前事务都是不可见的。而早于Read View创建的事务所做的修改均是可见
* 而在RC级别下的,事务中,每次快照读都会新生成一个快照和Read View, 这就是我们在RC级别下的事务中可以看到别的事务提交的更新的原因
作者:IT老哥
链接:https://juejin.cn/post/6871046354018238472
来源:掘金
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。
- 一.JVM
- 1.1 java代码是怎么运行的
- 1.2 JVM的内存区域
- 1.3 JVM运行时内存
- 1.4 JVM内存分配策略
- 1.5 JVM类加载机制与对象的生命周期
- 1.6 常用的垃圾回收算法
- 1.7 JVM垃圾收集器
- 1.8 CMS垃圾收集器
- 1.9 G1垃圾收集器
- 2.面试相关文章
- 2.1 可能是把Java内存区域讲得最清楚的一篇文章
- 2.0 GC调优参数
- 2.1GC排查系列
- 2.2 内存泄漏和内存溢出
- 2.2.3 深入理解JVM-hotspot虚拟机对象探秘
- 1.10 并发的可达性分析相关问题
- 二.Java集合架构
- 1.ArrayList深入源码分析
- 2.Vector深入源码分析
- 3.LinkedList深入源码分析
- 4.HashMap深入源码分析
- 5.ConcurrentHashMap深入源码分析
- 6.HashSet,LinkedHashSet 和 LinkedHashMap
- 7.容器中的设计模式
- 8.集合架构之面试指南
- 9.TreeSet和TreeMap
- 三.Java基础
- 1.基础概念
- 1.1 Java程序初始化的顺序是怎么样的
- 1.2 Java和C++的区别
- 1.3 反射
- 1.4 注解
- 1.5 泛型
- 1.6 字节与字符的区别以及访问修饰符
- 1.7 深拷贝与浅拷贝
- 1.8 字符串常量池
- 2.面向对象
- 3.关键字
- 4.基本数据类型与运算
- 5.字符串与数组
- 6.异常处理
- 7.Object 通用方法
- 8.Java8
- 8.1 Java 8 Tutorial
- 8.2 Java 8 数据流(Stream)
- 8.3 Java 8 并发教程:线程和执行器
- 8.4 Java 8 并发教程:同步和锁
- 8.5 Java 8 并发教程:原子变量和 ConcurrentMap
- 8.6 Java 8 API 示例:字符串、数值、算术和文件
- 8.7 在 Java 8 中避免 Null 检查
- 8.8 使用 Intellij IDEA 解决 Java 8 的数据流问题
- 四.Java 并发编程
- 1.线程的实现/创建
- 2.线程生命周期/状态转换
- 3.线程池
- 4.线程中的协作、中断
- 5.Java锁
- 5.1 乐观锁、悲观锁和自旋锁
- 5.2 Synchronized
- 5.3 ReentrantLock
- 5.4 公平锁和非公平锁
- 5.3.1 说说ReentrantLock的实现原理,以及ReentrantLock的核心源码是如何实现的?
- 5.5 锁优化和升级
- 6.多线程的上下文切换
- 7.死锁的产生和解决
- 8.J.U.C(java.util.concurrent)
- 0.简化版(快速复习用)
- 9.锁优化
- 10.Java 内存模型(JMM)
- 11.ThreadLocal详解
- 12 CAS
- 13.AQS
- 0.ArrayBlockingQueue和LinkedBlockingQueue的实现原理
- 1.DelayQueue的实现原理
- 14.Thread.join()实现原理
- 15.PriorityQueue 的特性和原理
- 16.CyclicBarrier的实际使用场景
- 五.Java I/O NIO
- 1.I/O模型简述
- 2.Java NIO之缓冲区
- 3.JAVA NIO之文件通道
- 4.Java NIO之套接字通道
- 5.Java NIO之选择器
- 6.基于 Java NIO 实现简单的 HTTP 服务器
- 7.BIO-NIO-AIO
- 8.netty(一)
- 9.NIO面试题
- 六.Java设计模式
- 1.单例模式
- 2.策略模式
- 3.模板方法
- 4.适配器模式
- 5.简单工厂
- 6.门面模式
- 7.代理模式
- 七.数据结构和算法
- 1.什么是红黑树
- 2.二叉树
- 2.1 二叉树的前序、中序、后序遍历
- 3.排序算法汇总
- 4.java实现链表及链表的重用操作
- 4.1算法题-链表反转
- 5.图的概述
- 6.常见的几道字符串算法题
- 7.几道常见的链表算法题
- 8.leetcode常见算法题1
- 9.LRU缓存策略
- 10.二进制及位运算
- 10.1.二进制和十进制转换
- 10.2.位运算
- 11.常见链表算法题
- 12.算法好文推荐
- 13.跳表
- 八.Spring 全家桶
- 1.Spring IOC
- 2.Spring AOP
- 3.Spring 事务管理
- 4.SpringMVC 运行流程和手动实现
- 0.Spring 核心技术
- 5.spring如何解决循环依赖问题
- 6.springboot自动装配原理
- 7.Spring中的循环依赖解决机制中,为什么要三级缓存,用二级缓存不够吗
- 8.beanFactory和factoryBean有什么区别
- 九.数据库
- 1.mybatis
- 1.1 MyBatis-# 与 $ 区别以及 sql 预编译
- Mybatis系列1-Configuration
- Mybatis系列2-SQL执行过程
- Mybatis系列3-之SqlSession
- Mybatis系列4-之Executor
- Mybatis系列5-StatementHandler
- Mybatis系列6-MappedStatement
- Mybatis系列7-参数设置揭秘(ParameterHandler)
- Mybatis系列8-缓存机制
- 2.浅谈聚簇索引和非聚簇索引的区别
- 3.mysql 证明为什么用limit时,offset很大会影响性能
- 4.MySQL中的索引
- 5.数据库索引2
- 6.面试题收集
- 7.MySQL行锁、表锁、间隙锁详解
- 8.数据库MVCC详解
- 9.一条SQL查询语句是如何执行的
- 10.MySQL 的 crash-safe 原理解析
- 11.MySQL 性能优化神器 Explain 使用分析
- 12.mysql中,一条update语句执行的过程是怎么样的?期间用到了mysql的哪些log,分别有什么作用
- 十.Redis
- 0.快速复习回顾Redis
- 1.通俗易懂的Redis数据结构基础教程
- 2.分布式锁(一)
- 3.分布式锁(二)
- 4.延时队列
- 5.位图Bitmaps
- 6.Bitmaps(位图)的使用
- 7.Scan
- 8.redis缓存雪崩、缓存击穿、缓存穿透
- 9.Redis为什么是单线程、及高并发快的3大原因详解
- 10.布隆过滤器你值得拥有的开发利器
- 11.Redis哨兵、复制、集群的设计原理与区别
- 12.redis的IO多路复用
- 13.相关redis面试题
- 14.redis集群
- 十一.中间件
- 1.RabbitMQ
- 1.1 RabbitMQ实战,hello world
- 1.2 RabbitMQ 实战,工作队列
- 1.3 RabbitMQ 实战, 发布订阅
- 1.4 RabbitMQ 实战,路由
- 1.5 RabbitMQ 实战,主题
- 1.6 Spring AMQP 的 AMQP 抽象
- 1.7 Spring AMQP 实战 – 整合 RabbitMQ 发送邮件
- 1.8 RabbitMQ 的消息持久化与 Spring AMQP 的实现剖析
- 1.9 RabbitMQ必备核心知识
- 2.RocketMQ 的几个简单问题与答案
- 2.Kafka
- 2.1 kafka 基础概念和术语
- 2.2 Kafka的重平衡(Rebalance)
- 2.3.kafka日志机制
- 2.4 kafka是pull还是push的方式传递消息的?
- 2.5 Kafka的数据处理流程
- 2.6 Kafka的脑裂预防和处理机制
- 2.7 Kafka中partition副本的Leader选举机制
- 2.8 如果Leader挂了的时候,follower没来得及同步,是否会出现数据不一致
- 2.9 kafka的partition副本是否会出现脑裂情况
- 十二.Zookeeper
- 0.什么是Zookeeper(漫画)
- 1.使用docker安装Zookeeper伪集群
- 3.ZooKeeper-Plus
- 4.zk实现分布式锁
- 5.ZooKeeper之Watcher机制
- 6.Zookeeper之选举及数据一致性
- 十三.计算机网络
- 1.进制转换:二进制、八进制、十六进制、十进制之间的转换
- 2.位运算
- 3.计算机网络面试题汇总1
- 十四.Docker
- 100.面试题收集合集
- 1.美团面试常见问题总结
- 2.b站部分面试题
- 3.比心面试题
- 4.腾讯面试题
- 5.哈罗部分面试
- 6.笔记
- 十五.Storm
- 1.Storm和流处理简介
- 2.Storm 核心概念详解
- 3.Storm 单机版本环境搭建
- 4.Storm 集群环境搭建
- 5.Storm 编程模型详解
- 6.Storm 项目三种打包方式对比分析
- 7.Storm 集成 Redis 详解
- 8.Storm 集成 HDFS 和 HBase
- 9.Storm 集成 Kafka
- 十六.Elasticsearch
- 1.初识ElasticSearch
- 2.文档基本CRUD、集群健康检查
- 3.shard&replica
- 4.document核心元数据解析及ES的并发控制
- 5.document的批量操作及数据路由原理
- 6.倒排索引
- 十七.分布式相关
- 1.分布式事务解决方案一网打尽
- 2.关于xxx怎么保证高可用的问题
- 3.一致性hash原理与实现
- 4.微服务注册中心 Nacos 比 Eureka的优势
- 5.Raft 协议算法
- 6.为什么微服务架构中需要网关
- 0.CAP与BASE理论
- 十八.Dubbo
- 1.快速掌握Dubbo常规应用
- 2.Dubbo应用进阶
- 3.Dubbo调用模块详解
- 4.Dubbo调用模块源码分析
- 6.Dubbo协议模块