企业🤖AI智能体构建引擎,智能编排和调试,一键部署,支持私有化部署方案 广告
在上一篇里面,bingxi和alex思考了information_schema,这个一直在innodb外围打转。没有进入到innodb的内部。在后续的文章中,以innodb的为主,逐个思考。Bingxi和alex今天了解了fil文件管理。 对应的文件为: D:/mysql-5.1.7-beta/storage/innobase/fil/fil0fil.c D:/mysql-5.1.7-beta/storage/innobase/include/fil0fil.h ## 1)所谓的tablespace Bingxi:“alex,配置项有一个选项innodb_file_per_table,也就是每个表有一个自己的tablespace。 14.2.3.1. Using Per-Table Tablespaces You can store each InnoDB table and its indexes in its own file. This feature is called “multiple tablespaces” because in effect each table has its own tablespace. ” Alex:“是的,bingxi。不过tablespace这个概念我们借鉴了oracle中的命名:表空间。在oracle中,tablespace表示表的集合,也就是很多个表放到同一个逻辑整体里面。” Bingxi:“是的,相比myisam,每个myisam表对应三个文件。而innodb可以将很多表放到一个文件或者多个文件里面,这个叫共享表空间。另外,如果innodb_file_per_table加到配置文件,则每个新建的innodb表则使用独立表空间。” Alex:“bingxi,那什么叫独立表空间呢?我们需要来debug一下代码。假设我们使用系统默认的参数启动,则会有两个tablespace,第一个tablespace包括一个文件ibdata1,这个也可以称为系统表空间,另外一个space包括两个日志文件。” Bingxi:“是的,我们参考了oracle的系统表空间就知道系统表空间里面会存放很多字典信息。这里我们先不说那么远,先说下如果我们需要将系统表空间的文件数量增加,应该怎么填写?因为我们是debug环境下,我们在D:/mysql-5.1.7-beta目录下创建一个my.ini,在其中写入两行参数: [mysqld] [innodb_data_file_path]= ibdata1:10M;ibdata2:20M:autoextend 这表示系统表空间里面就会有两个文件,其中第一个文件ibdata1是10M,第二个文件大小是是20M,并且可以进行自动扩展。 ” Alex:“好吧,我们现在先配置下文件,然后看看系统内部是如何管理这些文件的。先看看文件系统的定义。 ~~~ //文件系统管理结构 typedef    struct fil_system_struct fil_system_t; struct fil_system_struct {   ……   //下面两个表空间用于快速查找space,fil_system_t结构用于整个fil的管理。   //注意:这里的最低粒度是文件        hash_table_t*  spaces;             //根据space id进行hash的space        hash_table_t*  name_hash;  //根据space name进行hahs的space        ……               //file space的链表,比如这里有两个space,一个是系统表空间,一个是log space        UT_LIST_BASE_NODE_T(fil_space_t) space_list; };   从上面的结构中,我们可以看到fil_system_t与fil_space_t是一对多的关系。 /* Tablespace or log data space: let us call them by a common name space */ struct fil_space_struct {        char*             name;      //space name = 该space的第一个文件名        ulint        id;       //space id        ……     //该space包含的文件结点链表        UT_LIST_BASE_NODE_T(fil_node_t) chain;  //文件链表   ……                  //指向下一个space        UT_LIST_NODE_T(fil_space_t) space_list;        …… }; ~~~   从这个结构中我们也可以看出,fil_space_struct与fil_node_t也是一对多的关系,也就是一个space下面可以包含多个文件。从我们的my.ini中可以得知我们的系统表空间是对应两个文件:ibdata1、ibdata2。我们来具体看看fil_node_t的定义。 ~~~ /* File node of a tablespace or the log data space */ struct fil_node_struct {        fil_space_t*    space;     //所属的space        char*             name;        //文件路径        ibool              open;        //文件是否打开        os_file_t  handle;  //文件句柄        ulint        size;   //文件大小   ……        UT_LIST_NODE_T(fil_node_t) chain;  //文件结点链表        …… }; ~~~ 启动后的图如下图1 //file space的链表,比如这里有两个space,一个是系统表空间,一个是log space        UT_LIST_BASE_NODE_T(fil_space_t) space_list; ![](https://box.kancloud.cn/2016-07-22_5791c9c0a7bcc.gif) ” Bingxi:“是的,我们看下系统表空间这个space里的size这个字段,里面的size为1920,等于对应的两个文件大小的相加,640+1280。这个640是怎么计算的呢,文件页的大小为16k,而ibdata1的大小为10M,因此对应的页数为640页。因此这里的值为640。同样的ibdata2的页数为20M/16k=1280。” Alex:“好的,我们可以看到这里仅仅是将结点生成了,还需要将日志文件以及系统表空间的的文件打开,保持打开直到数据库shut down。 ~~~ int innobase_start_or_create_for_mysql(void) {        ……     //打开所有的日志文件以及系统表空间中的文件,保持打开直到数据库shut down        fil_open_log_and_system_tablespace_files();   …… } ~~~ 在开始进一步之前,我们先看下独立表空间。目前正在使用的是系统表空间,执行语句,往系统表空间里面插入数据。执行后将数据库shut down。然后往my.ini里面增加一行配置用于使用独立表空间。 [mysqld] innodb_data_file_path = ibdata1:10M;ibdata2:20M:autoextend innodb_file_per_table = 1   重启后执行如下语句 mysql> use test; Database changed mysql> create table t2(id int) engine=innodb; Query OK, 0 rows affected (0.02 sec) 执行语句后,我们可以发现test生成了两个文件:t2.frm以及t2.ibd。同时,我们测试下,能不能在配置为独立表空间的情况下,执行查询语句,发现还是可以使用共享表空间(和系统表空间一个意思)的数据。 mysql> select * from t1; +------+-------+ | id   | name  | +------+-------+ |    1 | name1 | |    2 | name2 | +------+-------+ 2 rows in set (0.02 sec) 同理,我们重新修改my.ini,去掉独立表空间的配置项,也能使用之前创建的t2表。然后看下文件系统的space_list的数量为3了。也就是t2表对应的表空间。   ![](https://box.kancloud.cn/2016-07-22_5791c9c0c5c82.gif) ” Bingxi“我们先说到这里吧,内容还是很多的,建议将fil0fil.c中每个函数设置一个断点,然后通过语句调试的方式来掌握,比如往t1里面插数据,直到30M数据不够,要进行文件的扩展,然后跟踪进去看下如何进行文件的扩展等等。” Alex:“是的,我们今天聊了表空间管理,那么后续就可以讨论系统表空间内是如何组织数据的了。” Bingxi:“alex,先把基础的讲下,比如今天里面包含的两个常用结构:hash_table_t、UT_LIST_NODE_T。” Alex:“嗯,可以的,我们下次聊这个。”