企业🤖AI智能体构建引擎,智能编排和调试,一键部署,支持私有化部署方案 广告
## 体系结构 InnoDB的体系结构: :-: ![](https://img.kancloud.cn/45/3f/453f9e9c71c3e45ef04d5d1cd339c20d_656x387.png) 后台线程可以分为: * Master Thread:负责将缓冲池的数据异步刷新到磁盘,保证数据一致性。 * IO Thread:使用AIO来处理IO请求,一般情况下有4个读线程和4个写线程。 :-: ![](https://img.kancloud.cn/75/06/75068392f8d7e92691a5f9ee7c2f25ed_530x137.png) * Purge Thread:回收已经使用并分配的undo页。 * page Cleaner Thread:刷新之前版本中的脏页数据。 **缓冲区** InnoDB的内存结构可以分为如下几个部分: * 缓冲池:多存放表和索引数据。 * 更改缓冲区:保存insert、delete、update等更改操作的缓冲区。 * 自适应哈希索引:存放在程序运行中生成的自适应哈希索引结构。 * 日志缓冲区:日志缓冲区的内容会定期刷新到磁盘。 InnoDB存储引擎内存池的缓冲区可以起到和cache类似的作用。查看当前系统InnoDB缓冲区的大小: :-: ![](https://img.kancloud.cn/95/e8/95e81d453093d7f6e3c7a54790910349_523x96.png) 默认为128M 缓冲池中缓存的数据页类型有:索引页、数据页、undo页、插入缓冲(insert buffer)、自适应哈希索引(adaptive hash index)、InnoDB存储的锁信息(lock info)、数据字典信息(data dictionary)。其内部结构如下: :-: ![](https://img.kancloud.cn/e9/f1/e9f19c87e95913150e7a4db175888ede_647x264.png) 查看缓冲池的数量(会将每个页根据哈希值平均分配到不同的缓冲池实例中) :-: ![](https://img.kancloud.cn/64/2a/642a060cc14efba0abcd665c497e23c4_568x100.png)   **如何管理内存** InnoDB使用LRU算法来进行内存缓存页的管理。在InnoDB存储引擎中,缓冲池页的大小默认为16KB,与普通的LRU算法不同的是,LRU列表还加入Midpoint位置。对于读取到新的页,不再是直接放到最前面的位置,而是放在midpoint的位置,这个位置在LRU列表长度的5/8处。InnoDB将midpoint之前的列表称为new(活跃的)列表,将midpoint之后的列表称为old列表。 :-: ![](https://img.kancloud.cn/1b/d9/1bd9c72fd50792276ee00481dafb8ccf_524x97.png) \[old列表占尾端37%\] LRU列表用来管理已经从磁盘读取到的页,但是数据库刚启动的时候,LRU列表是空的,没有任何的页。这时页都存放在Free列表中。 同时innodb可能会对每个页的内容进行压缩,对于非16KB大小的页,是通过unzip\_LRU列表进行管理的;每个页可能被压缩成2KB、4KB、8KB大小。unzip\_LRU是对不同的尺寸的页进行管理的,同时利用**伙伴系统**进行内存大小的分配。例如当需要对内存申请4KB大小的页时,会进行如下操作: * 查看4KB列表是否有足够的空间,有直接分配。 * 否则查看8KB列表是否有足够的空间,有将8KB大小的空闲页划分为2个4KB大小的页,放入4KB大小的unzip\_LRU列表中。 * 如果8KB大小列表没有足够空间,则从16KB中的LRU申请空闲页,划分成一个8KB和2个4KB的页放入对应的unzip\_LRU列表中 脏页:在LRU列表中的页被修改之后,该页就会被称为脏页,这个时候缓冲池中的页和磁盘中的页数据不一致。数据库会通过checkpoint机制将脏页刷回到磁盘中,而Flush列表页即为脏页列表。`脏页会同时保留在LRU列表和Flush列表。`因此Flush列表用来负责将脏页刷回到磁盘中。 使用`show engine innodb status\G;`可以查看各个列表中的大小 :-: ![](https://img.kancloud.cn/70/7d/707dc1aa2b19ad1dab244076d80e7c94_583x174.png)   **redo log缓冲** InnoDB会将重做日志信息放到redo log buffer中,并且按照一定的频率刷入磁盘中,刷入磁盘的时机为: 1. Master Thread每秒将redo log buffer刷新到redo log file中。 2. 每个事务提交时会将redo log buffer刷新到redo log file中。 3. 当redo log buffer缓冲区小于1/2的时候,会将redo log buffer刷新到redo log file中。 查看redo log buffer大小 ~~~  show variables like 'innodb_log_buffer_size'\G; ~~~   ## checkpoint checkpoint(检查点)技术是为了解决如下几个问题: 1. 缩短数据库进行重做日志时的恢复时间。 2. 缓冲池不够用时,将脏页刷新到磁盘,一次刷新多少? 3. 重做日志不可用时,刷新脏页。 checkpoint技术要做的事情就是将缓冲池中的脏页刷回到磁盘,每次刷新多少页,每次从哪里取脏页(LRU列表、Flush列表),以及什么时间触发Checkpoint。 触发Checkpoint的时间点: 1、 Sharp Checkpoint:数据库关闭的时候将所有脏页刷新到磁盘中。 2、Fuzzy Checkpoint:一次刷新一部分的脏页,而不是将所有的脏页进行刷新。 * Master Thread Checkpoint:Master Thread线程每秒或者每十秒异步的刷新一定比例的脏页回盘。 * FLUSH\_LRU\_LIST Checkpoint: 当LRU中的可用页不够的时候,需要将LRU列表中尾端的一些脏页刷新回磁盘。在新的版本中使用Page Cleaner线程来检查LRU列表是否有足够的可用页。 * Async/Sync Flush Checkpoint:重做日志不可用的时候刷新。 * Dirty Page too much Checkpoint:当脏页数量超过一定比例的时候Innodb引擎就会强制进行Checkpoint,保证缓冲池中有足够的可用页。这个比例可以通过`show variables like 'innodb_max_dirty_pages_pct'\G`查看。 :-: ![](https://img.kancloud.cn/a3/9f/a39f259ab7cbd0ec5b3f7160a6cf9655_573x99.png) 【超过90%时候进行刷新】