一分钟带你学会MySQL覆盖索引,让你的SQL更高效
覆盖索引是MySQL优化sql性能的一种非常重要而且常用的手段,通过覆盖索引,我们可以直接查询到需要的结果,而不用回表,从而大大减少树的搜索次数,非常明显的提升查询性能。
数据如何存储与查找
我们知道,MySQL的数据都是存储在B+树上的,每一个索引都代表一个B+树。
对于主键索引,叶子节点存储的是一行记录的所有字段值(逻辑上),而非主键索引的叶子节点存储的是主键值,非叶子节点存储的是索引以及指向数据的指针。
那我们查询数据的时候,MySQL是如何执行的呢?
以主键索引为例,就是在主键索引树上,从根节点出发,一直向下查找,直到找到符合条件的记录。
如果我们要查下图中的User2节点,那么查找路径就是UserA->UserC->UserF->User2。
回表
只按照主键查询是一种理想中的状态,随着业务逐渐复杂,表中的字段会越来越多,我们也会建立更多的非主键索引以应对业务带来的挑战。
但是非主键索引会带来一个问题:回表。
以下面这条sql为例:
select * from t where m in (3,4);
我们在表t的m字段上设置一个索引,那么这条sql的执行流程就是:
- 在索引树m上,找到记录3,获取到主键id,比如id=100;
- 拿着100这个id去主键索引树上,获取到这一行的数据;
- 在索引树m上,找到记录4,获取到主键id,比如id=101;
- 拿着101这个id去主键索引树上,获取到这一行的数据;
- 在索引树上查找下一个记录5(不一定是5,这里的5只是代表记录4后面的一条记录),记录5不符合查询条件,结束查询。
在上面的流程中,步骤2,4代表了回主键索引树搜索,这个动作就叫做回表。
而MySQL之所以做回表这个动作,是因为我们要查的数据 select *,只有在主键索引树上才有,所以不得不回表查询。
覆盖索引
如果我们把上面的sql改成下面这样:
select id from t where m in (3,4);
这个时候只需要查询id就行,而id这个值已经在m索引树上了,这时就不用再回表了,可以直接提供查询结果。
可以说,索引m覆盖了我们的查询请求,这种情况我们就称为覆盖索引。
这也是为什么我们在很多MySQL规范中可以看到,要求我们查询数据时尽量避免"select *",就是因为"select *"会导致覆盖索引失效,从而引起强制回表,sql性能可能大幅下降。
最后
在我们查询SQL时,我们不仅要考虑where条件是否匹配了索引,还要尽量考虑查询的字段是否可以通过索引直接获取,覆盖索引可以减少树的搜索次数,显著的提升SQL查询性能。
- 06-16卡巴斯基郑启良:支持信创发展是卡巴斯基的重要使命
- 06-16访问管理是确保现代工作场所安全的的五个关键原因
- 06-16零信任安全的演变:彻底改变网络安全策略
- 06-16GitHub上值得关注的20个网络安全项目
- 06-16英国曼彻斯特大学遭遇网络攻击,机密数据或遭窃!
- 06-16调查表明广告软件推送恶意软件感染了六万多个安卓应用程序
- 06-16微软向美国政府提供GPT的大模型,安全性如何保证?
- 06-16如何保护OT环境免受安全威胁?
- 01-11全球最受赞誉公司揭晓:苹果连续九年第一
- 12-09罗伯特·莫里斯:让黑客真正变黑
- 12-09谁闯入了中国网络?揭秘美国绝密黑客小组TA
- 12-09警示:iOS6 惊现“闪退”BUG
- 12-05亚马逊推出新一代基础模型 任意模态生成大模
- 12-05OpenAI拓展欧洲业务 将在苏黎世设立办公室
- 12-05微软质疑美国联邦贸易委员会泄露信息 督促其
- 12-05联交所取消宝宝树上市地位 宝宝树:不会对公
- 12-04企业微信致歉:文档打开异常已完成修复