五天手撕数据结构之——树形结构(二)
AVL 树:高度平衡的守护者
AVL 树是最早被发明的自平衡二叉搜索树,以其发明者 Adelson-Velsky 和 Landis 的名字命名。
AVL 树的核心思想非常简单:对于树中的任意一个节点,其左子树和右子树的高度差不能超过 1。
基本概念和特点:
- 严格平衡:对于任意节点,其左子树与右子树的高度差(称为“平衡因子”)的绝对值 ≤ 1
- **高度始终为 O(log n)**:由于严格平衡,AVL 树的高度最多约为 1.44 × log₂(n + 2) - 0.328
- 每个节点需存储高度或平衡因子:为了快速判断是否失衡,通常在节点中额外存储:子树高度(
height),或平衡因子(bf = left.height - right.height)
如图,插入75之后右侧右右失衡,执行左旋转


java版本实现AVL树

| package com.springdemo.demo.binarytree;
class AVLNode { int val; int height; AVLNode left, right;
public AVLNode(int val) { this.val = val; this.height = 1; } }
public class AVLTree { private AVLNode root;
private int height(AVLNode node) { return node == null ? 0 : node.height; }
private void updateHeight(AVLNode node) { if (node != null) { node.height = 1 + Math.max(height(node.left), height(node.right)); } }
private int getBalance(AVLNode node) { return node == null ? 0 : height(node.left) - height(node.right); }
private AVLNode rotateRight(AVLNode y) { AVLNode x = y.left; AVLNode T2 = x.right;
x.right = y; y.left = T2;
updateHeight(y); updateHeight(x);
return x; }
private AVLNode rotateLeft(AVLNode x) { AVLNode y = x.right; AVLNode T2 = y.left;
y.left = x; x.right = T2;
updateHeight(x); updateHeight(y);
return y; }
public void insert(int val) { root = insertRec(root, val); }
private AVLNode insertRec(AVLNode node, int val) { if (node == null) { return new AVLNode(val); }
if (val < node.val) { node.left = insertRec(node.left, val); } else if (val > node.val) { node.right = insertRec(node.right, val); } else { return node; }
updateHeight(node);
int balance = getBalance(node);
if (balance > 1 && val < node.left.val) { return rotateRight(node); }
if (balance < -1 && val > node.right.val) { return rotateLeft(node); }
if (balance > 1 && val > node.left.val) { node.left = rotateLeft(node.left); return rotateRight(node); }
if (balance < -1 && val < node.right.val) { node.right = rotateRight(node.right); return rotateLeft(node); }
return node; }
public void delete(int val) { root = deleteRec(root, val); }
private AVLNode deleteRec(AVLNode node, int val) { if (node == null) return null;
if (val < node.val) { node.left = deleteRec(node.left, val); } else if (val > node.val) { node.right = deleteRec(node.right, val); } else { if (node.left == null || node.right == null) { AVLNode temp = (node.left != null) ? node.left : node.right; if (temp == null) { temp = node; node = null; } else { node = temp; } } else { AVLNode temp = minValueNode(node.right); node.val = temp.val; node.right = deleteRec(node.right, temp.val); } }
if (node == null) return null;
updateHeight(node);
int balance = getBalance(node);
if (balance > 1 && getBalance(node.left) >= 0) { return rotateRight(node); }
if (balance > 1 && getBalance(node.left) < 0) { node.left = rotateLeft(node.left); return rotateRight(node); }
if (balance < -1 && getBalance(node.right) <= 0) { return rotateLeft(node); }
if (balance < -1 && getBalance(node.right) > 0) { node.right = rotateRight(node.right); return rotateLeft(node); }
return node; }
private AVLNode minValueNode(AVLNode node) { AVLNode current = node; while (current.left != null) { current = current.left; } return current; }
public void inorder() { System.out.print("中序遍历: "); inorderRec(root); System.out.println(); }
private void inorderRec(AVLNode node) { if (node != null) { inorderRec(node.left); System.out.print(node.val + " "); inorderRec(node.right); } }
public boolean isAVL() { return isAVLRec(root) != -1; }
private int isAVLRec(AVLNode node) { if (node == null) return 0;
int leftHeight = isAVLRec(node.left); if (leftHeight == -1) return -1;
int rightHeight = isAVLRec(node.right); if (rightHeight == -1) return -1;
if (Math.abs(leftHeight - rightHeight) > 1) { return -1; }
return 1 + Math.max(leftHeight, rightHeight); }
public static void main(String[] args) { AVLTree avl = new AVLTree();
avl.insert(10); avl.insert(20); avl.insert(30);
avl.inorder(); System.out.println("是 AVL 树? " + avl.isAVL());
avl.insert(40); avl.insert(50); avl.insert(25);
avl.inorder(); System.out.println("高度平衡? " + avl.isAVL());
avl.delete(30); avl.inorder(); System.out.println("删除后仍平衡? " + avl.isAVL()); } }
|
红黑树:工程实践的王者
红黑树是另一种自平衡二叉搜索树,它在AVL树的基础上做了一些”妥协”。它不像AVL树那样追求绝对平衡,而是通过一套更宽松的规则来保证大致平衡,从而减少在插入/删除时的旋转次数,在整体性能上取得了更好的工程实践效果。Java的 TreeMap、TreeSet 和 C++ STL 的 map、set 底层都使用了红黑树。
基本概念和特点:
- 每个节点非红即黑。
- 默认插入就是红色。
- 根节点是黑色的。
- 所有叶子节点(NIL空节点)都是黑色的。
- 红色节点的子节点必须是黑色的(即不能有连续的红色节点)。
- 从任一节点到其每个叶子节点的所有路径都包含相同数目的黑色节点。
规则 4 和 5 是红黑树平衡的关键。规则 5 保证了没有一条路径会比其他路径长出两倍以上,从而实现了大致平衡。
红黑树构成示意图

java实现红黑树

| package com.springdemo.demo.binarytree;
public class RedBlackTree<T extends Comparable<T>> { private enum Color { RED, BLACK }
private static class Node<T> { T value; Node<T> left; Node<T> right; Node<T> parent; Color color;
public Node(T value) { this.value = value; this.color = Color.RED; this.left = null; this.right = null; this.parent = null; } }
private Node<T> root; private final Node<T> NIL;
public RedBlackTree() { NIL = new Node<>(null); NIL.color = Color.BLACK; root = NIL; }
private void leftRotate(Node<T> x) { Node<T> y = x.right; x.right = y.left;
if (y.left != NIL) { y.left.parent = x; } y.parent = x.parent;
if (x.parent == NIL) { root = y; } else if (x == x.parent.left) { x.parent.left = y; } else { x.parent.right = y; } y.left = x; x.parent = y; }
private void rightRotate(Node<T> y) { Node<T> x = y.left; y.left = x.right;
if (x.right != NIL) { x.right.parent = y; } x.parent = y.parent;
if (y.parent == NIL) { root = x; } else if (y == y.parent.right) { y.parent.right = x; } else { y.parent.left = x; } x.right = y; y.parent = x; }
private void insertFixup(Node<T> z) { while (z.parent.color == Color.RED) { if (z.parent == z.parent.parent.left) { Node<T> uncle = z.parent.parent.right;
if (uncle.color == Color.RED) { z.parent.color = Color.BLACK; uncle.color = Color.BLACK; z.parent.parent.color = Color.RED; z = z.parent.parent; } else { if (z == z.parent.right) { z = z.parent; leftRotate(z); } z.parent.color = Color.BLACK; z.parent.parent.color = Color.RED; rightRotate(z.parent.parent); } } else { Node<T> uncle = z.parent.parent.left;
if (uncle.color == Color.RED) { z.parent.color = Color.BLACK; uncle.color = Color.BLACK; z.parent.parent.color = Color.RED; z = z.parent.parent; } else { if (z == z.parent.left) { z = z.parent; rightRotate(z); } z.parent.color = Color.BLACK; z.parent.parent.color = Color.RED; leftRotate(z.parent.parent); } } } root.color = Color.BLACK; }
public void insert(T value) { Node<T> z = new Node<>(value); Node<T> y = NIL; Node<T> x = root;
while (x != NIL) { y = x; if (z.value.compareTo(x.value) < 0) { x = x.left; } else { x = x.right; } } z.parent = y;
if (y == NIL) { root = z; } else if (z.value.compareTo(y.value) < 0) { y.left = z; } else { y.right = z; }
z.left = NIL; z.right = NIL; insertFixup(z); }
public void inOrderTraversal() { inOrderHelper(root); }
private void inOrderHelper(Node<T> node) { if (node != NIL) { inOrderHelper(node.left); System.out.print(node.value + "(" + node.color + ") "); inOrderHelper(node.right); } }
public static void main(String[] args) { RedBlackTree<Integer> rbTree = new RedBlackTree<>(); rbTree.insert(50); rbTree.insert(45); rbTree.insert(60); rbTree.insert(42); rbTree.insert(46); rbTree.insert(40); rbTree.insert(43); rbTree.insert(65);
System.out.println("中序遍历结果:"); rbTree.inOrderTraversal(); } }
|
B树与B+树:磁盘存储的引擎
我们之前学的二叉搜索树、AVL 树、红黑树,全是为「内存中的数据查找」设计的,它们的优点是查询快(O(logn)),但有一个致命缺陷:
这类树的节点层级多、高度偏高,而且每次只能从一个节点跳转一个子节点。
而我们实际开发中,99% 的数据都存在硬盘 / 磁盘中(比如 MySQL 数据库、文件系统),磁盘的「寻址速度」极慢、「连续读数据」极快 ——硬盘最讨厌的就是「频繁寻址跳转」,最喜欢「一次性读一片数据」。
二叉树家族在磁盘场景下完全不适用:一次查询要跳十几次磁盘,速度慢到无法接受。
B 树的诞生唯一目的:为「磁盘 / 外存存储」量身设计的搜索树,最大化减少磁盘寻址次数,最大化利用磁盘的连续读取优势!
基本概念和特点:
- 每个节点最多有 m 个子节点。
- 每个非根、非叶子节点至少有 ⌈m/2⌉ 个子节点。
- 根节点至少有2个子节点(除非它本身是叶子节点)。
- 所有叶子节点都位于同一层。
- 一个非叶子节点如果有 k 个子节点,则它包含 k-1 个键,这些键将子树的值域划分开。


B 树的「矮胖」结构,完美适配磁盘的读写特性!
磁盘的两个核心特性:
- 磁盘的 寻址时间(找到数据在磁盘的位置):极慢,一次寻址≈10ms;
- 磁盘的 连续读取时间(找到位置后读一片数据):极快,读 1KB 和读 100KB 几乎一样快。
二叉树的致命缺点(磁盘场景):
二叉树是「瘦高」的,比如存 100 万条数据,二叉树的高度大约是 20 层 → 意味着查询一次要 磁盘寻址 20 次 → 总耗时≈200ms,慢到无法接受。
B 树的极致优势(磁盘场景):
B 树是「矮胖」的,节点能存大量数据,比如一个磁盘块能存 100 个关键字 → 100 万条数据的 B 树高度只有 34 层 → 查询一次只需要 **磁盘寻址 34 次** → 总耗时≈30ms,速度提升 6~7 倍!
本质:B 树把「多次磁盘寻址」变成「少量磁盘寻址」,把「零散读」变成「批量读」,这就是 B 树的封神之处。
B + 树是 B 树的优化升级版,核心设计目标是 更适配磁盘存储、更高效支持数据库的查询场景(单值查询、范围查询、排序等)。它的所有特点都围绕 “提升磁盘 IO 效率” 和 “优化查询体验” 展开。
基本概念和特点:
「数据只存叶子,索引只存非叶」—— 非叶子节点更 “轻”,树更矮胖
特点细节:非叶子节点(根、中间层):只存「关键字(索引)+ 子树指针」,不存完整数据(比如 MySQL 中不存行数据,只存主键值);叶子节点:存「完整关键字 + 数据地址 / 完整数据」(MySQL 中叶子节点存整行数据或主键到行数据的指针)。
对比 B 树:B 树的非叶子节点也存数据,导致一个节点能存的索引数量少,树更高。
实际价值:非叶子节点更 “小”,一个磁盘块能装更多索引 → 树的高度比 B 树更低(比如 100 阶 B + 树存 1 亿数据,高度仅 3 层),磁盘寻址次数更少,查询更快。
「叶子节点全在同一层」—— 绝对平衡,查询时间稳定
特点细节:和 B 树一样,所有叶子节点都处于树的最底层,没有 “深浅不一” 的情况。
对比 B 树:两者一致,都是绝对平衡树(区别于红黑树的 “相对平衡”)。
实际价值:任何数据的查询都要经过「根→中间层→叶子」的固定路径,查询时间复杂度永远是 O(logn),没有最坏情况差异,数据库查询更稳定。
「叶子节点用链表串联」—— 范围查询 / 排序秒完成
「关键字冗余存储」—— 非叶节点关键字是叶子节点的 “索引副本”
特点细节:非叶子节点的所有关键字,都会在叶子节点中重复出现(比如非叶节点存了 “50”,叶子节点中也一定有 “50”)。
对比 B 树:B 树的关键字只存一次,不存在冗余。
实际价值:非叶节点只需要 “指引路径”,无需存数据,进一步压缩非叶节点大小,让树更矮胖;同时叶子节点包含所有关键字,遍历链表就能获取全量数据,无需依赖非叶节点。
「节点内关键字有序,支持二分查找」—— 节点内查询极快
特点细节:每个节点(无论非叶还是叶子)的关键字都按升序 / 降序排列,查询时先对节点内关键字做二分查找,再决定走哪个指针。
对比 B 树:两者一致,都是 “节点内二分 + 节点外指针跳转”。
实际价值:节点内查询时间是 O(logk)(k 是节点内关键字数),几乎可以忽略(因为 k 通常是 100+,log2 (100)≈7),查询效率接近内存操作。
「适配磁盘 “预读” 机制」—— 最大化利用磁盘 IO 特性
特点细节:B + 树的节点大小被设计为「一个磁盘块的大小」(比如 4KB),磁盘读取时会 “预读” 整个节点(磁盘预读机制:读取一个数据时,会顺带读取相邻的一批数据,减少寻址)。
对比 B 树:B 树也能适配,但 B + 树的非叶节点更轻,预读的 “有效索引密度” 更高。
实际价值:一次磁盘 IO 就能读取一个完整节点的所有索引,无需多次读取,进一步减少磁盘 IO 次数。
