树的演进过程

二叉查找树（BST）

特点

任意节点左子树不为空，则左子树的值均小于根节点的值；
任意节点右子树不为空，则右子树的值均大于根节点的值；
任意节点的左右子树也分别是二叉查找树；
没有键值相等的节点。

局限

解决了排序的基本问题，比普通树查找更快，查找、插入、删除的时间复杂度为O(logN)。但是由于无法保证平衡，可能退化为链表。

平衡二叉树（自平衡二叉查找树，AVL）

特点

AVL树是带有平衡条件的二叉查找树，一般是用平衡因子差值判断是否平衡并通过旋转来实现平衡，左右子树树高不超过1，和红黑树相比，它是严格的平衡二叉树，平衡条件必须满足（所有节点的左右子树高度差不超过1）。

不管是执行插入还是删除操作，只要不满足上面的条件，就要通过旋转来保持平衡。

局限

由于维护这种高度平衡所付出的代价比从中获得的效率收益还大（旋转操作效率太低），故而实际的应用不多，更多的地方是用追求局部而不是非常严格整体平衡的红黑树。当然，如果应用场景中对插入删除不频繁，只是对查找要求较高，那么AVL还是较优于红黑树。

红黑树

特点

一种二叉查找树，但在每个节点增加一个存储位表示节点的颜色，可以是red或black。通过对任何一条从根到叶子的路径上各个节点着色的方式的限制，红黑树确保没有一条路径会比其它路径长出两倍。它是一种弱平衡二叉树（由于是若平衡，可以推出，相同的节点情况下，AVL树的高度低于红黑树），相对于要求严格的AVL树来说，它的旋转次数变少，所以对于搜索、插入、删除操作多的情况下，我们就用红黑树。

每个节点非红即黑；
根节点是黑的；
每个叶节点（叶节点即树尾端NULL指针或NULL节点）都是黑的；
如果一个节点是红的，那么它的两儿子都是黑的；
对于任意节点而言，其到叶子点树NULL指针的每条路径都包含相同数目的黑节点；
每条路径都包含相同的黑节点。

局限

通过舍弃严格的平衡和引入红黑节点，解决了AVL旋转效率过低的问题。但是在磁盘等场景下，树仍然太高，IO次数太多。

B类树的诞生

MySQL中的数据一般是放在磁盘中的，读取数据的时候肯定会有访问磁盘的操作，磁盘中有两个机械运动的部分，分别是盘片旋转和磁臂移动。

盘片旋转就是市面上所提到的多少转每分钟，而磁盘移动则是在盘片旋转到指定位置以后，移动磁臂后开始进行数据的读写。

这里就存在一个定位到磁盘中的块的过程，而定位是磁盘的存取中花费时间比较大的一块，毕竟机械运动花费的时候要远远大于电子运动的时间。当大规模数据存储到磁盘中的时候，显然定位是一个非常花费时间的过程，基于此进行优化的B类树就诞生了，提高磁盘读取时定位的效率。

为什么B类树可以进行优化呢？我们可以根据B类树的特点，构造一个多阶的B类树，然后在尽量多的在结点上存储相关的信息，保证层数尽量的少，以便后面我们可以更快的找到信息，磁盘的I/O操作也少一些，而且B类树是平衡树，每个结点到叶子结点的高度都是相同，这也保证了每个查询是稳定的。

B/B+树是为了磁盘或其它存储设备而设计的一种平衡多路查找树（相对于二叉树，B树每个内节点有多个分支），与红黑树相比，在相同的的节点的情况下，一颗B/B+树的高度远远小于红黑树的高度。B/B+树上操作的时间通常由存取磁盘的时间和CPU计算时间这两部分构成，而CPU的速度非常快，所以B树的操作效率取决于访问磁盘的次数，关键字总数相同的情况下B树的高度越小，磁盘I/O所花的时间越少。

B类树

B树

定义任意非叶子结点最多只有M个儿子，且M>2；
根结点的儿子数为[2, M]；
除根结点以外的非叶子结点的儿子数为[M/2, M]；
每个结点存放至少M/2-1（取上整）和至多M-1个关键字；（至少2个关键字）
非叶子结点的关键字个数=指向儿子的指针个数-1；
非叶子结点的关键字：K[1], K[2], …, K[M-1]，且K[i] < K[i+1]；
非叶子结点的指针：P[1], P[2], …, P[M]；其中P[1]指向关键字小于K[1]的子树，P[M]指向关键字大于K[M-1]的子树，其它P[i]指向关键字属于(K[i-1], K[i])的子树；
所有叶子结点位于同一层。