码迷,mamicode.com
首页 > 数据库 > 详细

MySQL索引的选择

时间:2020-11-26 14:09:43      阅读:10      评论:0      收藏:0      [点我收藏+]

标签:png   nbsp   b+树   存在   链接   这一   文件的   区别   等于   

MySQL默认支持两种类型的索引: 

技术图片

Hash索引和B+树索引:

 

那为什么不使用其他的数据结构作为索引?

Hash索引:哈希表的特点就是可以快速的精确查询,但是不支持范围查询。如果做成了索引,那速度也是很慢的,要全部扫描。

平衡二叉树:

 

技术图片

技术图片

 

 

 1、索引也不只是在内存里面存储的,还是要落盘持久化的,如果数据多了,树高会很高,查询的成本就会随着树高的增加而增加。如果采用的是机械硬盘,效率就会更低。

2、我们磁盘读取数据是按照磁盘块来读取的,所以我们需要把数据尽量多的放在磁盘块中;二叉树一个节点只能存储一个数据,即一个磁盘块只存储一个键值对,所以不采用二叉树的模型。

 

为什么我们使用B+树而不使用B树呢?

首先我们来看看B树和B+树的结构区别;

 

B树:

技术图片

 

 

 一颗m阶B树的定义如下:

1)每个结点最多有m-1个关键字。
2)根结点最少可以只有1个关键字。
3)非根结点至少有Math.ceil(m/2)-1个关键字。
4)每个结点中的关键字都按照从小到大的顺序排列,每个关键字的左子树中的所有关键字都小于它,而右子树中的所有关键字都大于它。
5)所有叶子结点都位于同一层,或者说根结点到每个叶子结点的长度都相同

在数据库中我们将B树(和B+树)作为索引结构,可以加快查询速速,此时B树中的key就表示键,而data表示了这个键对应的条目在硬盘上的逻辑地址。B树相比于二叉树而言,每个节点可以存储多个指针指向数据;故而可以减少磁盘I/O次数来提高查询效率。
 
B+树:
技术图片

一颗m阶B+树的定义如下:

1)B+树包含2种类型的结点:内部结点(也称索引结点)和叶子结点。根结点本身即可以是内部结点,也可以是叶子结点。根结点的关键字个数最少可以只有1个。
2)B+树与B树最大的不同是内部结点不保存数据,只用于索引,所有数据(或者说记录)都保存在叶子结点中。
3) m阶B+树表示了内部结点最多有m-1个关键字(或者说内部结点最多有m个子树),阶数m同时限制了叶子结点最多存储m-1个记录。
4)内部结点中的key都按照从小到大的顺序排列,对于内部结点中的一个key,左树中的所有key都小于它,右子树中的key都大于等于它。叶子结点中的记录也按照key的大小排列。
5)每个叶子结点都存有相邻叶子结点的指针,叶子结点本身依关键字的大小自小而大顺序链接

B+树相比于B树而言:
1、B+树的数据只存储在叶子节点中而非叶子节点只存储索引数据;我们知道索引本身也是很大的,需要以索引文件的形式存储在磁盘上,这样在索引查找的过程中可以减少磁盘 I/O的次数。
2、因为 B+ 树索引的所有数据均存储在叶子节点,而且数据是按照顺序排列的。那么 B+ 树使得范围查找,排序查找,分组查找以及去重查找变得异常简单。而 B 树因为数据分散在各个节点,要实现这一点是很不容易的。

 

技术图片

MySQL索引的选择

标签:png   nbsp   b+树   存在   链接   这一   文件的   区别   等于   

原文地址:https://www.cnblogs.com/-star/p/14018860.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!