数据结构_堆的原理分析以及应用场景

堆

数据结构中的堆是一种特殊的二叉树，不同于 Java 内存模型中的堆。

堆必须符合以下两个条件：

是一棵完全二叉树。
任意一个节点的值都大于（或小于）左右子节点的值。

从第一点可以知道，堆适合用数组来存储。

第二点中，若父节点都大于等于左右子节点，则被称为大顶堆，反之则为小顶堆。

如图，为一个大顶堆，

注意：堆首先得符合完全二叉树的特点，否则不是堆。

堆的实现方案

【下面代码均以大顶堆为例】

堆的存储

完全二叉树采用数组存储最省空间，并且对 CPU 缓存较链表友好。

如图，采用数组表示并空出 0 号位置，节点i的父节点为2xi，左右子节点分别为i/2和i/2+1。

堆的操作——插入数据

在堆尾（即数组末尾）插入数据，会导致破坏堆的特性，如图：

因此需要将被破坏的堆重新调整为堆，这个过程被称为堆化，堆化的操作可以自上而下，也可以自下而上。

图中插入元素8后，打破了大顶堆的特性，将元素8向上与其父节点比较，判断是否交换，若交换，则继续向上比较，直到所有父子节点符合要求。

代码实现：

public class Heap {
    private int[] heapData; // 数组，从下标 1 开始存储数据
    private int n;  // 堆可以存储的最大数据个数
    private int count; // 堆中已经存储的数据个数

    public Heap(int capacity) {
        heapData = new int[capacity + 1];
        n = capacity;
        count = 0;
    }

    public void insert(int data) {
        if (count >= n) 
    	    return; // 堆满了
        heapData[++count] = data;
        int i = count;
        while (i/2 > 0 && a[i] > a[i/2]) { // 自下往上堆化
            swap(heapData, i, i/2); //交换下标为 i 和 i/2 的两个元素
            i = i/2;
        }
    }
}

堆的操作——删除堆顶元素

如图，删除堆顶元素后，如何堆化？
通过自上而下的堆化后，发现：虽然已经符合堆的大小规则，但是确不符合完全二叉树的定义了。

改进
删除堆顶元素后，将堆尾元素放到堆顶，再进行堆化操作。

代码实现：

public void removeMax() {
    if (count == 0)
        return -1; // 堆中没有数据
    heapData[1] = heapData[count];
    --count;
    heapify(heapData, count, 1);
}

private void heapify(int[] heapData, int n, int i) { 
    // 自上往下堆化
    while (true) {
        int maxPos = i;
        int left = i*2;
        int right = i*2+1;
        if (left <= n && a[i] < heapData[left])
            maxPos = left;
        if (right <= n && heapData[maxPos] < heapData[right])
            maxPos = right;
        if (maxPos == i)
            break;
        swap(heapData, i, maxPos);
        i = maxPos;
    }
}

堆化的时间复杂度分析

从前面的分析可知道，堆化的对象是一棵完全二叉树，并且自上而下或自下而上以高度为单位进行比较交换，因此堆化的时间复杂度与树的高度直接相关。

完全二叉树的高度为： $log_2 n$

堆的应用场景

堆排序

以大小为k的大顶堆为例，大顶堆的顶部元素为最大的值，我们将它与堆尾元素交换，再将前k-1个元素进行堆化，重复上述操作，直到堆中元素只剩 1 个为止，最后得到数据依次从小到大排列。

代码实现：

// n 表示数据的个数，数组 heapData 中的数据从下标 1 到 n 的位置。
public static void heapSort(int[] heapData, int n) {
  buildHeap(heapData, n);//建堆
  int k = n;
  while (k > 1) {
    swap(heapData, 1, k);
    --k;
    heapify(heapData, k, 1);
  }
}