MySQL（四）｜《千万级大数据查询优化》第一篇：创建高性能的索引（补充） · php开发笔记

本文是[MySQL（三）｜《千万级大数据查询优化》第一篇：创建高性能的索引]的一个补充。主要包括如下几点： 1. 关于`sex`列创建索引的处理 sex可以理解为那种选择性不高，但是可能很多查询都会用到的列。考虑到使用的频率，还是建议在创建不同组合索引的时候将它作为前缀。但是根据经验法则（**将选择性最高的列放到索引最前列**）不是说不应该在选择性低的列上创建索引吗？那为什么这里要将sex列字段作为索引的前缀列？这里有两个理由：第一点，几乎所有的查询都会用到它；第二点，索引中加上这一列也没有坏处，即使查询没有使用sex列也可以通过一些“诀窍”绕过，这个诀窍就是：如果每个查询不限制性别，那么可以通过在查询条件中新增`AND SEX IN('m', 'f')`来让MySQL选择该索引。这样写并不会过滤任何行，和没有这个条件时返回的结果相同。但是必须加上这个列的条件，MySQL才能够匹配索引的最左前缀。 2. 避免创建冗余和重复索引重复索引的概念很好理解，我们也不会出现创建两个`idx_ab`、`idx_ab`的索引，很多时候是在不经意间创建的。关于冗余，就得做一个说明啦。举例如下，我在新建一个表时，要把ID设置为主键，必须保证它是唯一的，还要在它身上加上索引： ~~~objectivec create table test( ID INT NOT NULL PRIMARY KEY, A INT NOT NULL, B INT NOT NULL, UNIQUE(ID), INDEX(ID), )ENGINE-InnoDB; ~~~ 因为MySQL的唯一限制和主键限制都是通过索引实现的，所以实际上上面对ID创建了3个重复的索引。如果创建了索引`idx_ab`，再创建索引`idx_a`就是冗余索引，创建索引`idx_b`或`idx_ba`都不是冗余索引。（这个冗余只是对B-Tree索引来说的） 3. 找出未使用的索引，进行删除除了冗余索引和重复索引，可能还会有一些服务器永远不用的索引，这种索引完全是累赘，需要删除。有很多工具可以帮助定位未使用的索引。 4. 没有万金油般的索引，也没有放之四海而皆准的经验法则经常在网上听到一些经验法则，包括我在上一篇文章中也提到过一些法则： “在多列索引中将选择性最高的列放在第一列”、“应该为where子句中出现的所有列创建索引”...所有的法则都只是在特定场景才有效果。 5. 定期维护索引和表维护表有三个主要的目的：找到并修复损害的表，维护准确的索引统计信息，减少碎片。 6. 对索引的优点做一个总结索引的优点： 1）索引大大减少了服务器需要扫描的数据量。 2）索引可以帮助服务器避免排序和临时表。 3）索引可以将随机I/O变为顺序I/O。