💎一站式轻松地调用各大LLM模型接口,支持GPT4、智谱、星火、月之暗面及文生图 广告
本文是[MySQL(三)|《千万级大数据查询优化》第一篇:创建高性能的索引]的一个补充。 主要包括如下几点: 1. 关于`sex`列创建索引的处理 sex可以理解为那种选择性不高,但是可能很多查询都会用到的列。考虑到使用的频率,还是建议在创建不同组合索引的时候将它作为前缀。 但是根据经验法则(**将选择性最高的列放到索引最前列**)不是说不应该在选择性低的列上创建索引吗?那为什么这里要将sex列字段作为索引的前缀列?这里有两个理由: 第一点,几乎所有的查询都会用到它; 第二点,索引中加上这一列也没有坏处,即使查询没有使用sex列也可以通过一些“诀窍”绕过,这个诀窍就是:如果每个查询不限制性别,那么可以通过在查询条件中新增`AND SEX IN('m', 'f')`来让MySQL选择该索引。这样写并不会过滤任何行,和没有这个条件时返回的结果相同。但是必须加上这个列的条件,MySQL才能够匹配索引的最左前缀。 2. 避免创建冗余和重复索引 重复索引的概念很好理解,我们也不会出现创建两个`idx_ab`、`idx_ab`的索引,很多时候是在不经意间创建的。关于冗余,就得做一个说明啦。举例如下,我在新建一个表时,要把ID设置为主键,必须保证它是唯一的,还要在它身上加上索引: ~~~objectivec create table test( ID INT NOT NULL PRIMARY KEY, A INT NOT NULL, B INT NOT NULL, UNIQUE(ID), INDEX(ID), )ENGINE-InnoDB; ~~~ 因为MySQL的唯一限制和主键限制都是通过索引实现的,所以实际上上面对ID创建了3个重复的索引。 如果创建了索引`idx_ab`,再创建索引`idx_a`就是冗余索引,创建索引`idx_b`或`idx_ba`都不是冗余索引。(这个冗余只是对B-Tree索引来说的) 3. 找出未使用的索引,进行删除 除了冗余索引和重复索引,可能还会有一些服务器永远不用的索引,这种索引完全是累赘,需要删除。有很多工具可以帮助定位未使用的索引。 4. 没有万金油般的索引,也没有放之四海而皆准的经验法则 经常在网上听到一些经验法则,包括我在上一篇文章中也提到过一些法则: “在多列索引中将选择性最高的列放在第一列”、“应该为where子句中出现的所有列创建索引”...所有的法则都只是在特定场景才有效果。 5. 定期维护索引和表 维护表有三个主要的目的:找到并修复损害的表,维护准确的索引统计信息,减少碎片。 6. 对索引的优点做一个总结 索引的优点: 1)索引大大减少了服务器需要扫描的数据量。 2)索引可以帮助服务器避免排序和临时表。 3)索引可以将随机I/O变为顺序I/O。