深入浅出MySQL索引(二)InnoDB存储引擎的索引

2023-10-31

深入浅出MySQL索引(一)常见的索引模型
深入浅出MySQL索引(二)InnoDB存储引擎的索引

深入浅出MySQL索引(二)InnoDB存储引擎的索引


在上一篇文章中介绍了为什么需要索引,以及常见的索引模型,本文讲介绍InnoDB的索引

InnoDB使用B+Tree来组织索引,每个索引都是一棵B+Tree,不过对于主键索引和普通索引有所不同,下面讲详细介绍

一、InnoDB的索引模型

使用下面的语句创建一张表

create table users(
	id int primary key,
  k int not null,
  name varchar(16),
  index(k)
)engine=innodb;

其中我们指定id为主键索引,k为普通索引

我们插入数据指定id和k的值分别为(150,1)、(200,2)、(350,3)、(550,5) 和 (600,6)

1.1 主键索引

MySQL将主键索引称为聚簇索引,为什么称为聚簇索引呢?因为数据表的数据和索引是一起构建在一棵B+Tree里的,也就是数据表的数据就存在于B+Tree的叶子节点中,例如上述表中id的索引如下所示

在这里插入图片描述

1.2 普通索引

普通索引称为辅助索引,如上述表的k就是一个普通索引,普通索引于主键索引的区别是,普通索引的叶子节点存放的不是数据,而是主键值,如下所示

在这里插入图片描述

下面举个例子来说明如何使用普通索引来查询

执行下面的sql语句的查询过程是什么样的呢?

select * from users where k=2;

首先会通过k索引这颗B+Tree找到对应的主键为200,然后再使用200在主键索引这颗B+Tree检索出数据

这个操作称为回表

二、索引维护

我们来看主键索引的B+Tree,如果添加一个主键值为700的数据行,那么只要再最后面追加数据就行了。但是如果添加一个主键值为400的数据行就比较麻烦了,此时需要将此页后面的数据往后移动,再插入数据,这是一个比较费劲的操作。更糟糕的情况是,如果此页满了,那么就需要分配新的页,原本放在一个页的数据就分为两个页存放,空间利用率就变低了,这个过程称为页分裂。当然如果两个页由于数据被删除导致利用率很低,就会发生页合并

基于上述的情况,一般将主键设置为自增主键是个比较合理的选择,自增主键可以通过NOT NULL PRIMARY KEY AUTO_INCREMENT在建表的时候指定

另外从普通索引的角度来看,普通索引的叶子节点存放的是主键,如果主键越大,建立普通索引占用的空间就越大,所以从性能和存储的角度考虑,主键使用自增主键也是一个比较合理的选择。

三、覆盖索引

我们在建立索引的时候,不仅仅可以使用一个列来作为一个索引,还可以使用多个列来一个索引,称为联合索引

如上述表

create table users(
	id int primary key,
  k int not null,
  name varchar(16),
  index(k)
)engine=innodb;

现在我们要查找k=5的用户它的name,对应的sql语句如下

select name from users where k=5;

这条语句的查找过程是:首先要在k索引树上面查找对应的主键值,然后在主键索引上查找,最后检索出相应的数据行,也就是需要一次回表操作

假如现在我们建立(k,name)这样的联合索引,如下所示

create table users(
	id int primary key,
  k int not null,
  name varchar(16),
  index(k),
  index(k,name)
)engine=innodb;

那么现在就有一棵新的索引树,这个索引树的key是(k,name)联合,根据列的顺序来进行排序,比如先比较k,k相等的情况下再比较name

此时的B+Tree如下所示

在这里插入图片描述

由于此时name的值已经存在于索引中,所以再执行下面的sql语句就不需要再进行回表操作了

select name from users where k=5;

同样的,主键id的值也存在于索引中,所以执行下面的sql语句也不需要进行回表操作

select id, name from users where k=5;

四、最左前缀原则

我们可以使用联合索引来加快查询,但是只有满足最左前缀原则的时候,才能使用联合索引来加速

最左索引原则解释起来可能会有点抽象,下面通过例子来说明

例如上面我们的建立来一个联合索引(k,name)

我们使用k来查询符合最左前缀原则,可以使用索引来加速,例如下面的sql语句

select * from users where k=5;

如果我们使用k和name来查询,符合最左前缀原则,可以使用索引来加速,例如下面的sql语句

select * from users where k=5 and name='xxx';

如果我们使用k和name的前面一部分来查询,符合最左前缀原则,可以使用索引来加速

比如表中有个一个数据,k和name的值为(5,‘Justin’),可以使用下面的sql语句来查询

select * from users where k=5 and name='jus%';

如果我们单纯使用name来查询则不符合最左前缀原则,不能使用(k,name)联合索引来加速,如下面的sql语句

select * from users where name="xxx";
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

深入浅出MySQL索引(二)InnoDB存储引擎的索引 的相关文章

  • 如何修改现有表以添加时区

    我有一个包含 500 多个表的大型应用程序 我必须将应用程序转换为时区感知 当前应用程序使用new java util Date GETDATE 与服务器的时区 即没有任何时区支持 我已将这项任务分为几个步骤 以便于开发 我确定的第一个步骤
  • 从按日期时间排序的 MySQL 表中获取用户的最后一个条目

    我有一张看起来像这样的桌子 USERNAME DATA DATETIME Jhon text1 2010 06 01 16 29 43 Mike text2 2010 06 01 16 29 22 Silver text3 2010 05
  • Galera 集群问题

    我想在我们的生产环境中使用Galera集群 但我有一些顾虑 每个表必须至少定义一个显式主键 每个表必须运行在InnoDB或XtraDB存储引擎下 分批处理您的大额交易 例如 不要让一个事务插入 100 000 行 而是将其分成更小的块 例如
  • MySQL - 从临时表插入

    这看起来非常简单 但我坚持使用简单的插入语句 见下文 begin work CREATE TEMPORARY TABLE IF NOT EXISTS insert table AS select r resource id fr file
  • 连接 Netbeans 和 MySQL 但出现大整数错误

    所以我正在尝试向我的 Netbeans 数据库 即 MySQL 添加新连接 但我遇到了大整数转换错误 有人可以帮助我吗 详细地 我右键单击现有的MySQL 服务器位于 localhost 3306 root 已断开连接 gt gt 选择co
  • 如果没有找到值,如何让 MySQL 中的 SUM 函数返回“0”?

    假设我在 MySQL 中有一个简单的函数 SELECT SUM Column 1 FROM Table WHERE Column 2 Test 如果没有条目Column 2 包含文本 Test 然后该函数返回NULL 而我希望它返回 0 我
  • MySQL 8 用逗号分割字符串并将其转换为JSON ARRAY

    我有以下字符串 a b c d 我想将它转换成一个 json 数组 像这样 a b c d MySQL 8 有什么函数可以实现这个功能吗 Try SELECT CAST CONCAT REPLACE a b c d AS JSON See
  • 不带 GROUP BY 的聚合查询

    这个查询似乎在我的旧机器上完美运行 但是 在我的 MySQL 5 7 14 和 PHP 5 6 25 的新机器上 它会抛出错误 致命错误 未捕获异常 PDOException 并带有消息 SQLSTATE 42000 语法错误或访问冲突 1
  • 错误代码:1305。函数或过程不存在

    因此 我在 MySQL 中创建一个函数 然后尝试向用户授予使用该函数的权限 但我无法这样做 这就是我正在做的 DELIMITER USE rxhelp36 scbn DROP FUNCTION IF EXISTS businessDayDi
  • 在 jQuery AJAX 成功中从 MySql 获取特定响应

    好吧 我有这个 ajax 代码 它将在 Success 块中返回 MySql 的结果 ajax type POST url index php success function data alert data My Query sql SE
  • 让登录更安全

    我已使用此代码进行管理员登录 仅当用户输入正确的用户名和密码时才应打开loginhome php 但后来我意识到这根本不安全 任何人都可以直接访问 mywebsite loginhome php 而无需登录 注销后 可以使用后退按钮打开 l
  • ORDER BY 字段内的 MySQL 子查询。 (没有内连接)

    有很多与此相关的问题 但都具有使用内部联接的相同答案 这 我认为 在这里是不可能的 如果我错了请告诉我 我现在正在做的是调用两个不同的 mysql 查询来获取结果 它工作完美 db gt query SELECT FROM meta WHE
  • PHP MySql 百分比

    我的问题是关于百分比 我不是专家 所以我会尽力以更好的方式进行解释 我的 mysql 服务器中有一个表 假设有 700 条记录 如下所示 Name country language Birth Lucy UK EN 1980 Mari Ca
  • 将庞大数据库从亚马逊RDS导出到本地mysql

    我在 Amazon RDS 上有一个 mysql 数据库 大约 600GB 数据 我需要将其移回本地专用服务器 但我不知道从哪里开始 每次我尝试初始化 sqldump 时它都会冻结 有没有办法将其移至 S3 甚至可能在开始下载之前将其分成更
  • MySQL/PDO::quote() 尽管使用 PDO::PARAM_INT 参数,但仍在整数周围加上引号

    无论我传递给什么值 数据类型对 它都会出现 pdo gt quote value type 它总是将其引用为字符串 echo pdo gt quote foo PDO PARAM STR foo as expected echo pdo g
  • Mysql用in语句限制

    我正在写一个查询 SELECT user bookmarks id as user bookmark id bookmark id user bookmarks user id bookmark url bookmark website b
  • 如何通过Elasticsearch模糊匹配电子邮件或电话?

    我想通过 Elasticsearch 对电子邮件或电话进行模糊匹配 例如 匹配所有以以下结尾的电子邮件 gmail com or 匹配所有电话开头136 我知道我可以使用通配符 query wildcard email gmail com
  • SQL查询查找表的主键?

    我怎样才能找到哪一列首要的关键使用查询来创建表 这是重复的question https stackoverflow com questions 893874 mysql determine tables primary key dynami
  • 通过触发器应用表的列权限

    现在 我有一个名为 Members 的表 其中包含内容 分为联系人数据 银行数据 现在 管理员应该能够创建 更新 删除用户 这些用户保存在另一个表中 该表只能访问管理员 用户应该获得自己的 mysql 用户帐户 管理员还应该能够设置权限 例
  • SQL 最近日期

    我需要在 php 中获取诸如 2010 04 27 之类的日期作为字符串 并在表中找到最近的 5 个日期 表中的日期保存为日期类型 您可以使用DATEDIFF http dev mysql com doc refman 5 1 en dat

随机推荐

  • C++/Python机器学习—感知机(二分类)

    一 Python import numpy as np import matplotlib pyplot as plt 定义预测函数 def predict x w b 计算特征向量和权重向量的点积 dot product np dot x
  • chrome浏览器 docker_使用docker安装elasticsearch

    1 使用docker安装 拉取镜像docker pull elasticsearch 6 5 4 创建容器docker create name elasticsearch net host e discovery type single n
  • 通过这些case,我把项目LCP时间减少了1.5s

    您好 如果喜欢我的文章 可以关注我的公众号 量子前端 将不定期关注推送前端好文 前言 最近在做公司几个项目性能优化 整理出一些比较有用且常见的case来分享一下 A项目优化 白屏相关 DNS预连接 资源预解析 对于公共域名g alicdn
  • Python 大数据分析教程_1_大数据分析概述

    本章内容 理解数据 认识数据分析 数据分析工具Python 集成开发环境和文本编辑器 使用Jupter Notebook 理解数据 需要分析的数据一般是结构化的 半结构化的 非结构化的数据集合 大部分数据集都能够被转化为更加适合分析和建模的
  • openwrt路由器samba拒绝访问

    openwrt路由器samba拒绝访问 第一步 第一步 检查软件包 进入路由器web后台页面 系统 软件包 按ctrl f键查找samba软件包安装情况 例如 我的系统就有 autosamba luci app samba luci i18
  • Postfix+Cyrus-IMAP + Cyrus-SASL + MySQL + IMP 配置指南

    CNGNU Postfix邮件系统系列指南之一 Postfix Cyrus IMAP Cyrus SASL MySQL IMP完全指南 作者 王兴宇
  • iphonex苹果手机Exchange邮箱设置同步的邮件天数

    苹果手机Exchange邮件设置 同步的邮件天数 步骤 1 找到手机 设置 2 找到 账户与密码 3 找到 Exchage 4 找到 要同步的邮件天数 5 选择要保留的天数
  • leetcode shell 4道题

    最近在学习shell 发现leetcode上shell的4道题还是比较不错的 整理了一下 193 Valid Phone Numbers 电话号码匹配 easy grep 0 9 0 9 0 9 0 9 0 9 0 9 0 9 0 9 0
  • IOU

    IOU 即交并比 应用 NMS 过滤重叠框 mAP import numpt as np def get IOU pred bbox gt bbox ixmin max pred bbox 0 gt bbox 0 iymin max pre
  • 【Java8日期】一文搞定Java8日期新特性

    目录标题 前言 Java8日期类型 简介 1 核心类 2 关键点 LocalDate 1 获取当前日期 年 月 日 2 获取月 周的第几天 3 随意创建日期 4 比较两个LocalDate是否相同 5 比较两个LocalDate的大小 6
  • Ant Design Pro入门介绍

    官方文档地址 https pro ant design zh CN 应用介绍 Ant Design Pro是一个企业级中后台前端 设计解决方案 基于React的中后台管理控制台的脚手架 能帮助我们快速的搭建企业级中后台管理系统 今天就为大家
  • python中pandas读写数据详解

    Pandas 库读取数据 Pandas 是一种开源数据分析工具 可以帮助我们更方便地处理和分析数据 Pandas 提供了许多函数来读取各种格式的数据 例如 CSV Excel SQL 等 读取 CSV 文件 CSV 文件是一种常用的数据格式
  • Win10 11 解决docker一直docker desktop starting和设置页面进不去问题

    PowerShell输入 注意一定是powershell输入命令 这个和cmd不一样 2 输入代码 cd C Program Files Docker Docker DockerCli exe SwitchDaemon 3 成功
  • 在WSL中安装zsh终端

    cmder中设置 新增task 名称为wsl bash 右下方的方框内填写 ConEmuBaseDirShort wsl PATH ConEmuBaseDirShort conemu cyg 64 exe wsl distro guid f
  • selenium之 定位以及切换frame(iframe)

    更多关于python selenium的文章 请关注我的专栏 Python Selenium自动化测试详解 总有人看不明白 以防万一 先在开头大写加粗说明一下 frameset不用切 frame需层层切 很多人在用selenium定位页面元
  • Android Studio引入jar包和so文件(armeabi和armeabi-v7a)

    一 引用jar文件 1 将jar文件复制 粘贴到app的libs目录中 2 右键点击jar文件 并点击弹出菜单中的 Add As Library 将jar文件作为类库添加到项目中 3 选择指定的类库 注 如果不执行2 3步 jar文件将不起
  • JVM虚拟机栈的栈帧结构中动态链接的理解

    深入理解Java虚拟机 书中原文写到 每个栈帧都包含一个指向运行时常量池中该栈帧所属方法的引用 持有这个引用是为了支持方法调用过程中的动态链接 Dynamic Linking 通过第六章的讲解 我们知道Class文件的常量池中存有大量的符号
  • HDU--3790:最短路径问题 (Dijkstra算法)

    1 题目源地址 http acm hdu edu cn showproblem php pid 3790 2 基本题意 找出最短路径 若有多条最短路径 输出那条花费最小的 注意过滤重边 3 源代码 HOJ 3790 最短路径问题 Dijks
  • <C++>学习:栈(Stack)操作

    前言 人生如逆旅 我亦是行人 容器适配器是一个封装了序列容器的类模板 它在一般序列容器的基础上提供了一些不同的功能 之所以称作适配器 是因为它可以通过适配容器现有的接口来提供不同的功能 stack lt T gt 容器适配器中的数据是以 L
  • 深入浅出MySQL索引(二)InnoDB存储引擎的索引

    深入浅出MySQL索引 一 常见的索引模型 深入浅出MySQL索引 二 InnoDB存储引擎的索引 深入浅出MySQL索引 二 InnoDB存储引擎的索引 文章目录 深入浅出MySQL索引 二 InnoDB存储引擎的索引 一 InnoDB的