ThinkChat2.0新版上线,更智能更精彩,支持会话、画图、阅读、搜索等,送10W Token,即刻开启你的AI之旅 广告
正确的顺序依赖于使用该索引的查询,并且同时需要考虑如何更好的满足排序和分组的需要(本节适用于B-Tree索引) 在一个多列B-Tree索引中,索引列的顺序意味着首先按照最左列进行排序,其次是第二列,等等.所以,索引可以按照升序或者降序进行扫描,以满足精确符合列顺序的ORDER BY,GROUP BY和DISTINCT等子句的查询需要 所以多列索引的列顺序很重要.在三星索引系统中,列顺序也决定了一个索引是否能够成为一个真正的三星索引 对于如何选择索引的列顺序有一个经验法则,将选择性最高的列放到索引最前列.这个建议在大部分场景下有用,但通常不如避免随机IO和排序那么重要,考虑问题需要全面 当不需要考虑排序和分组时,将选择性最高的列放在前面通常是好的.然而,性能不只是依赖于所有索引列的选择性(整体基数),也和查询条件的具体值有关,也就是和值的分布有关 以下面的查询为例子 ~~~ select * from payment where staff_id = 2 and customer_id = 584; ~~~ 是应该创建一个(staff_id,customer_id)索引还是应该颠倒下顺序?可以跑一些查询来确定在这个表中值的分布情况,并确定那个列的选择性更高.先用下面的查询预测下,看看where条件的分支对应的数据基数有多大 ~~~ select sum(staff_id = 2), sum(customer_id=584) from payment; ~~~ 根据结果,我们来决定把什么放到前面 这样做有一个地方需要注意,查询的结果非常依赖于选定的具体值.如果按照上述优化,可能对其他一些条件值的查询不公平,服务器的整体性能可能变得更糟,或者其他查询运行变得不如预期 如果是从比如pt-query-digest这样的工具的报告中提取最差查询,那么再按上述办法选定的索引顺序往往是非常高效的 ![](https://box.kancloud.cn/22f3a91db8177e6ccdeacaa0c77410b0_564x240.png) 最后,尽管关于选择性和基数的经验法值得研究,但是别忘了where子句中的排序,分组和范围条件等其他因素,这些因素可能对查询的性能造成非常大的影响