基数排序

提醒

本页面要介绍的不是 计数排序。

本页面将简要介绍基数排序。

定义

基数排序（英语：Radix sort）是一种非比较型的排序算法，最早用于解决卡片排序的问题。基数排序将待排序的元素拆分为 \(k\) 个关键字，逐一对各个关键字排序后完成对所有元素的排序。

如果是从第 \(1\) 关键字到第 \(k\) 关键字顺序进行比较，则该基数排序称为 MSD（Most Significant Digit first）基数排序；

如果是从第 \(k\) 关键字到第 \(1\) 关键字顺序进行比较，则该基数排序称为 LSD（Least Significant Digit first）基数排序。

k - 关键字元素的比较

下面用 \(a_i\) 表示元素 \(a\) 的第 \(i\) 关键字。

假如元素有 \(k\) 个关键字，对于两个元素 \(a\) 和 \(b\)，默认的比较方法是：

比较两个元素的第 \(1\) 关键字 \(a_1\) 和 \(b_1\)，如果 \(a_1 < b_1\) 则 \(a < b\)，如果 \(a_1 > b_1\) 则 \(a > b\)，如果 \(a_1 = b_1\) 则进行下一步；
比较两个元素的第 \(2\) 关键字 \(a_2\) 和 \(b_2\)，如果 \(a_2 < b_2\) 则 \(a < b\)，如果 \(a_2 > b_2\) 则 \(a > b\)，如果 \(a_2 = b_2\) 则进行下一步；
……
比较两个元素的第 \(k\) 关键字 \(a_k\) 和 \(b_k\)，如果 \(a_k < b_k\) 则 \(a < b\)，如果 \(a_k > b_k\) 则 \(a > b\)，如果 \(a_k = b_k\) 则 \(a = b\)。

例子：

如果对自然数进行比较，将自然数按个位对齐后往高位补齐 \(0\)，则一个数字从左往右数第 \(i\) 位数就可以作为第 \(i\) 关键字；
如果对字符串基于字典序进行比较，一个字符串从左往右数第 \(i\) 个字符就可以作为第 \(i\) 关键字；
C++ 自带的 std::pair 与 std::tuple 的默认比较方法与上述的相同。

MSD 基数排序

基于 k - 关键字元素的比较方法，可以想到：先比较所有元素的第 \(1\) 关键字，就可以确定出各元素大致的大小关系；然后对 具有相同第 \(1\) 关键字的元素，再比较它们的第 \(2\) 关键字……以此类推。

由于是从第 \(1\) 关键字到第 \(k\) 关键字顺序进行比较，由上述思想导出的排序算法称为 MSD（Most Significant Digit first）基数排序。

算法流程

将待排序的元素拆分为 \(k\) 个关键字，先对第 \(1\) 关键字进行稳定排序，然后对于每组 具有相同关键字的元素 再对第 \(2\) 关键字进行稳定排序（递归执行）……最后对于每组 具有相同关键字的元素 再对第 \(k\) 关键字进行稳定排序。

一般而言，我们默认基数排序是稳定的，所以在 MSD 基数排序中，我们也仅仅考虑借助 稳定算法（通常使用计数排序）完成内层对关键字的排序。

正确性参考上文 k - 关键字元素的比较。

参考代码

对自然数排序

下面是使用迭代式 MSD 基数排序对 unsigned int 范围内元素进行排序的 C++ 参考代码，可调整 \(W\) 和 \(\log_2 W\) 的值（建议将 \(\log_2 W\) 设为 \(2^k\) 以便位运算优化）。

C++
#include <algorithm>
#include <cstdint>
#include <stack>
#include <tuple>
#include <vector>

using std::copy;  // from <algorithm>
using std::make_tuple;
using std::stack;
using std::tie;
using std::tuple;
using std::vector;

using u32 = uint32_t;
using u64 = uint64_t;
using u32ptr = u32*;

void MSD_radix_sort(u32ptr first, u32ptr last) {
  static constexpr u32 maxlogW = 32;  // = log_2 W
  static constexpr u64 maxW = (u64)1 << maxlogW;

  static constexpr u32 logW = 8;
  static constexpr u32 W = 1 << logW;  // 计数排序的值域
  static constexpr u32 mask = W - 1;  // 用位运算替代取模，详见下面的 key 函数

  u32ptr tmp =
      (u32ptr)calloc(last - first, sizeof(u32));  // 计数排序用的输出空间

  using node = tuple<u32ptr, u32ptr, u32>;
  stack<node, vector<node>> s;
  s.push(make_tuple(first, last, maxlogW - logW));

  while (!s.empty()) {
    u32ptr begin, end;
    u32 shift;
    size_t length;

    tie(begin, end, shift) = s.top();
    length = end - begin;
    s.pop();

    if (begin + 1 >= end) continue;  // elements <= 1

    // 计数排序
    u32 cnt[W] = {};
    auto key = [](const u32 x, const u32 shift) { return (x >> shift) & mask; };

    for (u32ptr it = begin; it != end; ++it) ++cnt[key(*it, shift)];
    for (u32 value = 1; value < W; ++value) cnt[value] += cnt[value - 1];

    // 求完前缀和后，计算相同关键字的元素范围
    if (shift >= logW) {
      s.push(make_tuple(begin, begin + cnt[0], shift - logW));
      for (u32 value = 1; value < W; ++value)
        s.push(make_tuple(begin + cnt[value - 1], begin + cnt[value],
                          shift - logW));
    }

    u32ptr it = end;
    do {
      --it;
      --cnt[key(*it, shift)];
      tmp[cnt[key(*it, shift)]] = *it;
    } while (it != begin);

    copy(tmp, tmp + length, begin);
  }
  free(tmp);
}

对字符串排序

下面是使用迭代式 MSD 基数排序对空终止字节字符串基于字典序进行排序的 C++ 参考代码：

C++
#include <algorithm>
#include <stack>
#include <tuple>
#include <vector>

using std::copy;  // from <algorithm>
using std::make_tuple;
using std::stack;
using std::tie;
using std::tuple;
using std::vector;

using NTBS = char*;  // 空终止字节字符串
using NTBSptr = NTBS*;

void MSD_radix_sort(NTBSptr first, NTBSptr last) {
  static constexpr size_t W = 128;
  static constexpr size_t logW = 7;
  static constexpr size_t mask = W - 1;

  NTBSptr tmp = (NTBSptr)calloc(last - first, sizeof(NTBS));

  using node = tuple<NTBSptr, NTBSptr, size_t>;
  stack<node, vector<node>> s;
  s.push(make_tuple(first, last, 0));

  while (!s.empty()) {
    NTBSptr begin, end;
    size_t index, length;

    tie(begin, end, index) = s.top();
    length = end - begin;
    s.pop();

    if (begin + 1 >= end) continue;  // elements <= 1

    // 计数排序
    size_t cnt[W] = {};
    auto key = [](const NTBS str, const size_t index) { return str[index]; };

    for (NTBSptr it = begin; it != end; ++it) ++cnt[key(*it, index)];
    for (char ch = 1; value < W; ++value) cnt[ch] += cnt[ch - 1];

    // 求完前缀和后，计算相同关键字的元素范围
    // 对于 NTBS，如果此刻末尾的字符是 \0 则说明这两个字符串相等，不必继续迭代
    for (char ch = 1; ch < W; ++ch)
      s.push(make_tuple(begin + cnt[ch - 1], begin + cnt[ch], index + 1));

    NTBSptr it = end;
    do {
      --it;
      --cnt[key(*it, index)];
      tmp[cnt[key(*it, index)]] = *it;
    } while (it != begin);

    copy(tmp, tmp + length, begin);
  }

  free(tmp);
}

由于两个字符串的比较很容易冲上 \(O(n)\) 的线性复杂度，因此在字符串排序这件事情上，MSD 基数排序比大多数基于比较的排序算法在时间复杂度和实际用时上都更加优秀。

与桶排序的关系

前置知识：桶排序

桶排序需要其它的排序算法来完成对每个桶内部元素的排序。但实际上，完全可以对每个桶继续执行桶排序，直至某一步桶的元素数量 \(\le 1\)。

因此 MSD 基数排序的另一种理解方式是：使用桶排序实现的桶排序。

也因此，可以提出 MSD 基数排序在时间常数上的一种优化方法：假如到某一步桶的元素数量 \(\le B\)（\(B\) 是自己选的常数），则直接执行插入排序然后返回，降低递归次数。

LSD 基数排序

MSD 基数排序从第 \(1\) 关键字到第 \(k\) 关键字顺序进行比较，为此需要借助递归或迭代来实现，时间常数还是较大，而且在比较自然数上还是略显不便。

而将递归的操作反过来：从第 \(k\) 关键字到第 \(1\) 关键字顺序进行比较，就可以得到 LSD（Least Significant Digit first）基数排序，不使用递归就可以完成的排序算法。

算法流程

将待排序的元素拆分为 \(k\) 个关键字，然后先对 所有元素 的第 \(k\) 关键字进行稳定排序，再对 所有元素 的第 \(k-1\) 关键字进行稳定排序，再对 所有元素 的第 \(k-2\) 关键字进行稳定排序……最后对 所有元素 的第 \(1\) 关键字进行稳定排序，这样就完成了对整个待排序序列的稳定排序。

一个 LSD 基数排序全流程的例子

LSD 基数排序也需要借助一种 稳定算法 完成内层对关键字的排序。同样的，通常使用计数排序来完成。

LSD 基数排序的正确性可以参考《算法导论（第三版）》第 8.3-3 题的解法或参考下面的解释：

正确性

回顾一下 k - 关键字元素的比较方法，

假如想通过 \(a_1\) 和 \(b_1\) 就比较出两个元素 \(a\) 和 \(b\) 的大小，则需要提前知道通过比较 \(a_2\) 和 \(b_2\) 得到的结论，以便于应对 \(a_1 = b_1\) 的情况；
而想通过 \(a_2\) 和 \(b_2\) 就比较出两个元素 \(a\) 和 \(b\) 的大小，则需要提前知道通过比较 \(a_3\) 和 \(b_3\) 得到的结论，以便于应对 \(a_2 = b_2\) 的情况；
……
而想通过 \(a_{k-1}\) 和 \(b_{k-1}\) 就比较出两个元素 \(a\) 和 \(b\) 的大小，则需要提前知道通过比较 \(a_k\) 和 \(b_k\) 得到的结论，以便于应对 \(a_{k-1} = b_{k-1}\) 的情况；
\(a_k\) 和 \(b_k\) 可以直接比较。

现在，将顺序反过来：

\(a_k\) 和 \(b_k\) 可以直接比较；
而知道通过比较 \(a_k\) 和 \(b_k\) 得到的结论后，就可以得到比较 \(a_{k-1}\) 和 \(b_{k-1}\) 的结论；
……
而知道通过比较 \(a_2\) 和 \(b_2\) 得到的结论后，就可以得到比较 \(a_1\) 和 \(b_1\) 的结论；
而知道通过比较 \(a_1\) 和 \(b_1\) 得到的结论后，就最终得到了比较 \(a\) 和 \(b\) 的结论。

在这个过程中，对每个关键字边比较边重排元素的顺序，就得到了 LSD 基数排序。

伪代码

\[ \begin{array}{ll} 1 & \textbf{Input. } \text{An array } A \text{ consisting of }n\text{ elements, where each element has }k\text{ keys.}\\ 2 & \textbf{Output. } \text{Array }A\text{ will be sorted in nondecreasing order stably.} \\ 3 & \textbf{Method. } \\ 4 & \textbf{for }i\gets k\textbf{ down to }1\\ 5 & \qquad\text{sort }A\text{ into nondecreasing order by the }i\text{-th key stably} \end{array} \]

参考代码

下面是使用 LSD 基数排序实现的对 k - 关键字元素的排序。

C++
constexpr int N = 100010;
constexpr int W = 100010;
constexpr int K = 100;

int n, w[K], k, cnt[W];

struct Element {
  int key[K];

  bool operator<(const Element& y) const {
    // 两个元素的比较流程
    for (int i = 1; i <= k; ++i) {
      if (key[i] == y.key[i]) continue;
      return key[i] < y.key[i];
    }
    return false;
  }
} a[N], b[N];

void counting_sort(int p) {
  memset(cnt, 0, sizeof(cnt));
  for (int i = 1; i <= n; ++i) ++cnt[a[i].key[p]];
  for (int i = 1; i <= w[p]; ++i) cnt[i] += cnt[i - 1];
  // 为保证排序的稳定性，此处循环i应从n到1
  // 即当两元素关键字的值相同时，原先排在后面的元素在排序后仍应排在后面
  for (int i = n; i >= 1; --i) b[cnt[a[i].key[p]]--] = a[i];
  memcpy(a, b, sizeof(a));
}

void radix_sort() {
  for (int i = k; i >= 1; --i) {
    // 借助计数排序完成对关键字的排序
    counting_sort(i);
  }
}

实际上并非必须从后往前枚举才是稳定排序，只需对 cnt 数组进行等价于 std::exclusive_scan 的操作即可。

例题洛谷 P1177【模板】快速排序

给出 \(n\) 个正整数，从小到大输出。

C++
#include <algorithm>
#include <iostream>
#include <utility>

void radix_sort(int n, int a[]) {
  int *b = new int[n];  // 临时空间
  int *cnt = new int[1 << 8];
  int mask = (1 << 8) - 1;
  int *x = a, *y = b;
  for (int i = 0; i < 32; i += 8) {
    for (int j = 0; j != (1 << 8); ++j) cnt[j] = 0;
    for (int j = 0; j != n; ++j) ++cnt[x[j] >> i & mask];
    for (int sum = 0, j = 0; j != (1 << 8); ++j) {
      // 等价于 std::exclusive_scan(cnt, cnt + (1 << 8), cnt, 0);
      sum += cnt[j], cnt[j] = sum - cnt[j];
    }
    for (int j = 0; j != n; ++j) y[cnt[x[j] >> i & mask]++] = x[j];
    std::swap(x, y);
  }
  delete[] cnt;
  delete[] b;
}

int main() {
  std::ios::sync_with_stdio(false);
  std::cin.tie(nullptr);
  int n;
  std::cin >> n;
  int *a = new int[n];
  for (int i = 0; i < n; ++i) std::cin >> a[i];
  radix_sort(n, a);
  for (int i = 0; i < n; ++i) std::cout << a[i] << ' ';
  delete[] a;
  return 0;
}

性质

稳定性

如果对内层关键字的排序是稳定的，则 MSD 基数排序和 LSD 基数排序都是稳定的排序算法。

时间复杂度

通常而言，基数排序比基于比较的排序算法（比如快速排序）要快。但由于需要额外的内存空间，因此当内存空间稀缺时，原地置换算法（比如快速排序）或许是个更好的选择。¹

一般来说，如果每个关键字的值域都不大，就可以使用计数排序作为内层排序，此时的复杂度为 \(O(kn+\sum\limits_{i=1}^k w_i)\)，其中 \(w_i\) 为第 \(i\) 关键字的值域大小。如果关键字值域很大，就可以直接使用基于比较的 \(O(nk\log n)\) 排序而无需使用基数排序了。

空间复杂度

MSD 基数排序和 LSD 基数排序的空间复杂度都为 \(O(k+n)\)。

参考资料与注释

Thomas H. Cormen, Charles E. Leiserson, Ronald L. Rivest, and Clifford Stein.Introduction to Algorithms(3^rd ed.). MIT Press and McGraw-Hill, 2009. ISBN 978-0-262-03384-8. "8.3 Radix sort", pp. 199. ↩

本页面的全部内容在 小熊老师 - 莆田青少年编程俱乐部 0594codes.cn 协议之条款下提供，附加条款亦可能应用